Programmazione logica con vincoli

Vincoli in un linguaggio di programmazione:

toolkit: il programma memorizza i vincoli in delle opportune strutture dati, e poi chiama delle funzioni di libreria per trovare una soluzione
embedding: i vincoli fanno parte del linguaggio di programmazione

La programmazione logica a vincoli è del secondo tipo

Vincoli nel linguaggio: esempio

Un programma di questo tipo, come viene interpretato?

A(X,Y):-X<Y, B(X), C(Y).

Se sia X che Y hanno già un valore, allora X<Y si può valutare

Questa condizione può risultare vera oppure falsa

Nel primo caso, si valuta B(X) e poi C(Y)

Nel secondo caso, la clausola viene scartata e si passa ad altre clausole con A nella testa

Se X oppure Y non sono ancora valutate?

Variabili non valutate

Intuitivamente, valutare A(X,Y) su questo programma dovrebbe dare X=0, Y=1

A(X,Y):-X<Y, B(X), C(Y).
B(0).
C(1).

Mentre su quest'altro dovrebbe fallire:

A(X,Y):-X<Y, B(X), C(Y).
B(1).
C(0).

Quindi: la condizione X<Y non la posso valutare finchè non si hanno dei valori per X ed Y

Valutare un vincolo

La situazione vista è:

incontro un vincolo che non posso valutare (perchè contiene variabili non valutate)
se il vincolo è soddisfatto oppure no lo posso sapere solo facendo finta che il vincolo sia soddisfatto
quando il vincolo è valutabile, devo controllare se è soddisfatto oppure no

Principio: se incontro un vincolo non valutabile, lo devo memorizzare per poter poi controllare se verrà soddisfatto

Magazzino dei vincoli

Viene mantenuto un insieme di vincoli, detto constraint store (magazzino dei vincoli)

Quando si incontra un vincolo:

se è soddisfatto, si va avanti
se è violato si torna indietro come normalmente nel Prolog
se il vincolo non è nè valutabile, viene messo nel magazzino

Ogni volta che una variabile assume un valore, si va a controllare se ci sono vincoli valutabili nel magazzino

Magazzino dei vincoli: esempio

Si valuta A(X,Y) su questo programma:

A(X,Y):-X<Y, B(X), C(Y).
B(0).
C(1).
A(10,10).

Il meccanismo formale lo vediamo più avanti

Si inizia con il magazzino vuoto

Per ora, diciamo che al posto di A(X,Y) si prova a mettere X<Y, B(X), C(Y)

Dato che X<Y è un vincolo, viene aggiunto al magazzino

Esempio: cont.

Siamo al goal B(X), C(Y) con X<Y nel magazzino

Dato che abbiamo B(0) e C(1), il goal si dimostra con X=0, Y=1

Questo soddisfa il vincolo, per cui è una soluzione

Magazzino dei vincoli: esempio con vincolo non soddisfatto

Simile:

A(X,Y):-X<Y, B(X), C(Y).
B(1).
C(0).
A(10,10).

Ora però quando si arriva a valutare B(X), C(Y) con X<Y nel magazzino, l'unica possibilità è X=1, Y=0

Il vincolo nel magazzino non è soddisfatto

Si fa backtracking

Come?

Backtracking

Quando si arriva ad un fallimento, si torna indietro

I vincoli che si incontrano tornando indietro vengono eliminati dal magazzino

In sostanza, si è verificato che la clausola A(X,Y):-... non va bene

Dato che il vincolo X<Y era stato inserito nel magazzino solo perchè si era usata questa clausola, ora va tolto

Si prova A(10,10)

Questo va bene, perchè ora X<Y non è più nel magazzino

È quello che ci si aspetta: X<Y deve valere solo se si usa la prima clausola

Se si usa la seconda, questo vincolo non viene imposto

Consistenza del magazzino

Quando si incontra un vincolo non valutabile, lo si mette nel magazzino

Questo equivale ad assumerlo consistente per andare avanti; si vedrà se è effettivamente consistente quando sarà valutabile

Quindi, il magazzino contiene tutti i vincoli che sono stati assunti essere consistenti per andare avanti

Una sostituzione deve soddisfare tutti i vincoli del magazzino

Quindi, se l'insieme dei vincoli del magazzino non è consistente, è inutile andare avanti

Consistenza del magazzino: esempio

Si valuta A(X)

A(X):-X<0, B(X).
B(X):-X>0, C(X).
...

Facciamo una valutazione ad occhio (senza usare le fresh variables):

usando la prima clausola, X deve soddisfare X<0 se si riesce a dimostrare il goal B(X)
si mette quindi X<0 nel magazzino e si valuta B(X)
usando la seconda clausola, questo equivale ad assumere X>0 e dimostrare C(X)

Ora, C(X) si potrebbe anche dimostrare, soltanto che si è assunto che X soddisfi sia X<0 che X>0

Inutile andare avanti: non si potrà mai trovare un valore che soddisfi tutti i vincoli nel magazzino

Inconsistenza del magazzino

Se il magazzino diventa inconsistente, è inutile andare avanti: non si potrà mai trovare una valutazione che soddisfi tutti i vincoli

Si fa quindi backtracking; questo elimina vincoli dal magazzino

Consistenza locale

Conviene cercare di scoprire prima possibile se il magazzino è inconsistente

Questo fa risparmiare elaborazione

D'altra parte, verificare la consistenza ad ogni passo è un problema difficile

Si usano delle condizioni sufficienti, di solito arc consistency e hyperarch consistency

Programmazione logica senza vincoli

In generale, quando si ha un goal A(t1,t2) e una clausola A(t3,t4):-corpo con lo stesso predicato A nella testa, si procede cosí:

si crea una nuova variante (fresh variant) A(t5,t6):-nuovocorpo della clausola: questa è una clausola uguale ma che usa nuove variabili
si aggiunge all'unificazione corrente quello che risulta dall'unificazione di t1 e t5 e di t2 con t6
si rimpiazza il goal A(t1,t2) con nuovocorpo

Unificazione e vincoli

L'unificazione di due termini t1 e t5 si può vedere come un vincolo t1=t5

Si tratta di una uguaglianza fra due strutture ad albero

Su questo tipo di uguaglianza valgono delle regole di inferenza particolari:

f(...) è sempre diverso da g(...)
f(t1...tn) è uguale a g(s1,...sn) se e solo se t1=s1...tn=sn
...

Si tratta comunque di vincoli, solo che si usa questo meccanismo per vedere se sono soddisfatti e per fare inferenza

Sostituzioni

Una sostituzione X=valore si può anche vedere come un vincolo (di uguaglianza)

In questo caso perè si può sostituire il valore alla variabile in tutti gli altri vincoli

Generalizzazione

Si considerano vincoli:

quelli che stanno nelle clausole
quelli che derivano da uguaglianze di un goal con la testa di una clausola

I vincoli del secondo tipo si possono anche inserire nel corpo delle clausole

Per esempio, è possibile scrivere:

A(f(X),Y):-f(X)=Y, B(X).

Si possono anche avere disuguaglianze fra termini:

A(f(X),f(Y)):-f(X)!=f(Y), B(X).

Da questa si deriva X!=Y

Semplificazione

Considerare le uguaglianze di termini come vincoli permette di dare una semantica semplificata

L'interprete mantiene una lista di goal e il magazzino dei vincoli

Il passo generico è:

si prende il primo goal della lista; sia A(t1...tn) questo goal
si elimina questo letterale dal goal
per ogni clausola che ha A come predicato della testa:
1. si riscrive la clausola usando nuove variabili; sia A(s1...sn):-corpo il risultato della sostituzione
2. si aggiunge t1=s1...tn=sn al magazzino
3. si aggiungono i letterali di corpo, nell'ordine alla lista dei goal e i suoi vincoli al magazzino

Inferenza

Nel passo 3.2, si fa inferenza sul magazzino.

In particolare:

per vincoli del tipo termine1=termine2, si effettua la semplificazione (tipo unificazione)
per gli altri vincoli, si fa arc consistency

Questo può provare l'inconsistenza

Inconsistenza

Quando si ottiene inconsistenza, si procede a ritroso

si eliminano gli ultimi vincoli dal magazzino
si provano altre clausole

Algoritmo completo

È un algoritmo ricorsivo

si prende il primo goal della lista; sia A(t1...tn) questo goal
si elimina questo letterale dal goal
per ogni clausola che ha A come predicato della testa:
1. si riscrive la clausola usando nuove variabili; sia A(s1...sn):-corpo il risultato della sostituzione
2. si aggiunge t1=s1...tn=sn al magazzino
3. si aggiungono i letterali di corpo, nell'ordine alla lista dei goal e i suoi vincoli al magazzino
4. se il magazzino è consistente, si effettua la chiamata ricorsiva
5. se la chiamata ricorsiva dimostra il goal, si ritorna che il goal è dimostrato
6. altrimenti si elimina dalla lista dei goal e dal magazzino tutto quello che è stato aggiunto nel passo 3
si ritorna che il goal non è dimostrato

Valori effettivi

Una situazione che si potrebbe verificare è che il goal viene dimostrato senza valutare tutte le variabili:

A(X1,...,Xn):-vincolo1,B(X1,...,Xn).
B(X1,...,Xn):-vincolo2,C(X1,...,Xn).
    ...
W(X1,...,Xn):-vincolo23,Z(X1,...,Xn).
Z(X1,...,Xn).

Si accumulano tutti questi vincoli nel magazzino

Alla fine Z(X1,...,Xn) dimostra il goal

Però in tutto questo nessuna variabile è stata valutata

Quindi (in generale) non si può dire se i vincoli sono soddisfatti oppure no

Labeling

È un letterale particolare

Significato:

labeling([variabili]) = fai backtracking sulle variabili

Serve a lanciare un algoritmo di ricerca di una soluzione

Si cerca una valutazione delle variabili che soddisfa tutti i vincoli

Se la variabili non sono tutte, viene cercata una soluzione che soddisfa tutti i vincoli che non hanno altre variabili che non siano in [variabili]

Pratica della programmazione

Si scrivono le clausole scrivendo i vincoli dove si vede che servono

Quando si vuole generare effettivamente una valutazione, si mette labeling

Cosa usare prima?

A(variabili):-labeling([variabili]), vincoli.

Oppure:

A(variabili):-vincoli,labeling([variabili]).

Ordine fra vincoli e labeling

In generale, a parità di tutto il resto:

più vincoli ci sono, più è facile che inferenza (arc consistency,...) dimostri la insoddisfacibilitè
più vincoli ci sono, più piccolo è l'albero di ricerca in caso di insoddisfacibilità
più vincoli ci sono, meno soluzioni esistono in caso di soddisfacibilità

Quindi, conviene cercare di mettere prima i vincoli e poi il labeling

Unico caso in cui non conviene: se i vincoli riguardano variabili non collegate da molti vincoli a quelle precedenti

A(X):-X>0, Y>0, labeling([X,Y]).

Se trovare una soluzione per X e per Y è indipendente, tanto vale fare due labeling separati:

A(X):-X>0, labeling([X]), Y>0, labeling([Y]).

Ordine fra letterali

Dimostrare un letterale comporta backtracking:

A(X):-B(X), X>0.

Dimostrare B(X) potrebbe richiedere tempo

Poi magari si scopre che X>0 era già inconsistente

Conviene quindi mettere prima il vincolo e poi il letterale:

A(X):-X>0, B(X).

Dove mettere il labeling

Labeling lancia una ricerca, usando backtracking o un algoritmo simile

Se si mette troppo presto, si rischia di avere tante soluzioni possibili

A(X):-labeling([X]),B(X).

Molte potrebbero poi non essere consistenti con quello che segue

Nell'esempio, potrebbero risultare non consistenti con B(X)

D'altra parte, se non non verranno aggiunti altri vincoli sulle stesse variabili, conviene verificare subito la consistenza

A(X,Y):-labeling([X]), B(Y).

In generale: si mette quando si sono accumulati più o meno tutti i vincoli su un certo numero di variabili

Valore di ritorno

Nella programmazione logica senza vincoli, la valutazione di un goal può non portare ad un valore per tutte le variabili:

Esempio: goal A(X,Y,Z) con questo programma:

A(10,f(_),_).

Ritorna X=10,Y=f(_),Z=_

Può succedere anche quando ci sono vincoli

Variabili non instanziate nei vincoli

Se non si usa il labeling, lo stesso può succedere con i vincoli. Esempio: goal A(X,Y) e programma:

A(X,Y):-X<Y, B(Y).
B(1).

Viene valutato Y=1, ma non viene dato valore a X

Contrariamente a prima, non ha senso dire che X può assumere un valore qualsiasi

Infatti, X è vincolato da X<Y

Parallelo con-senza vincoli

Senza vincoli: sostituzione (es, X/10, Y/f(_), ...)

Con vincoli: constraint store (che include vincoli del tipo Y=1 ecc.)

Quello che viene ritornato è il contenuto del magazzino

Nel caso del programma di prima, viene ritornato:

Y=1, X<Y

Questo sarebbe il magazzino se i vincoli venissero semplicemente aggiunti

In pratica, il magazzino viene semplificato ogni volta che si aggiunge un vincolo, per cui in effetti viene ritornato:

Y=1, X<1

Dominio delle variabili

Il dominio di una variabile si specifica in questo modo:

X::[valori]

Si possono quindi specificare valori interi e valori definiti da costanti:

X::[1,2,3,4,5]
X::[1..5]
X::[tizio,caio,sempronio]

La prima e la seconda dichiarazione sono indipendenti

La terza dichiarazione specifica che il dominio di X contiene tre valori: tizio, caio e sempronio

Si possono anche specificare i domini di più variabili insieme, se sono uguali:

[X,Y]::[3,4,5]

Reali

Si possono specificare vincoli su variabili reali

Sono equaglianze e diseguaglianze fra espressioni reali

Le espressioni reali sono espressioni lineari costruite a partire da variabili usando costanti e operatori reali

Una volta inseriti nel magazzino, questi vincoli si semplificando usando:

eliminazione Gauss-Jordan per le equazioni (si riduce ogni equazione alla forma una_variabile=espressione_che non contiene la variabile)
eliminazine Fourier per disequazioni (non lo vediamo)

Espressioni miste reali-termini

Si possono avere termini del tipo f(X+1) ecc.

Per esempio, si potrebbe avere il goal A(f(X+1,Y)) e il programma:

A(f(Z,g(K)):-...

Questo porta ad inserire f(X+1,Y)=f(Z,g(K)) nel magazzino

Questo si semplifica a: {X+1=Z, Y=g(K)}

Notare che un vincolo del tipo X+1=f(Y) è violato, perchè X+1 si valuta a un valore (reale o intero) mentre f(Y) è sempre un termine

Detto in altro modo: f(qualcosa) può solo essere uguale a un termine con f nella radice

In altre parole, f(qualcosa) può essere uguale solo a f(qualcosa_altro), e a niente altro

Valutazione bottom-up

Nella programmazione a vincoli, può succedere che servano tutte le soluzioni, invece che una sola

Si può pensare di ottenere questo cercando tutti i modi di dimostrare il goal

Ossia, si può pensare di andare avanti dopo aver trovato il primo modo di dimostrare il goal

Questo però non sempre funziona

Andare avanti: esempio

Si cercano tutti i modi di dimostrare A(X) su questo programma:

A(q).
A(X):-B(X).
B(X):-A(X).

Per valutare A(X) ci sono due possibilità: usare A(q) oppure usare A(X):-B(X)

La clausola che viene provata per prima è A(q), che produce X=q come prima soluzione

Per andare avanti, si usa l'altra possibilità: A(X):-B(X)

Questo richiede di dimostrare B(X), che si può fare solo usando la terza clausola

Viene quindi richiesto di dimostrare di nuovo A(X), e qui ci sono due possibilità: usare A(q) oppure A(X):-B(X)

Viene di nuovo ritornato X=q, e c'è ancora un'altra possibilità aperta, che è quella di usare A(X):-B(X)

Cicli di valutazione

Il goal A(X) con il programma:

A(q).
A(X):-B(X).
B(X):-A(X).

Genera un ciclo, in cui vengono usate nell'ordine queste clausole:

A(q).
A(X):-B(X), B(X):-A(X), A(q).
A(X):-B(X), B(X):-A(X), A(X):-B(X), B(X):-A(X), A(q).
...

Si va avanti all'infinito senza mai trovare nuove soluzioni

Soluzioni non trovate

Andare in ciclo può portare a perdere delle soluzioni:

A(q).
A(X):-B(X).
B(X):-A(X).
A(r).

La valutazione di questo programma produce un ciclo in cui si usano solo le prime tre clausole

L'ultima non viene mai usata, per cui la soluzione X=r non viene mai ottenuta

Valutazione bottom-up

Serve quando si vogliono trovare tutte le soluzioni di un problema

Idea: invece di partire dal goal e trovare tutti i modi di dimostrarlo, si parte dai letterali e si vede cosa dimostrano

top-down: si parte dal goal e si cercano clausole che permettono di dimostrarlo; questo può richedere dimostrare (ricorsivamente) altri letterali
bottom-up: si parte dalle clausole senza corpo; queste clausole si usano per derivare altri letterali usando le clausole i cui letterali del corpo sono derivabili

Punto di partenza

Ogni clausola che non contiene letterali nel corpo si considera un possibile punto di partenza

A(X,Y):-X<Y, B(X,Y).
B(X,Y):-X>Y, Y>0.

La prima clausola non è un punto di partenza, perchè contiene B(X,Y) nel corpo

La seconda clausola va bene

Tecnicamente, significa: "B(X,Y) è vero se X>Y e se Y>0"

Ora si può usare A(X,Y):-X<Y, B(X,Y) perchè B(X,Y) è attualmente dimostrato (condizionalmente)

Questo dimostra che "A(X,Y) è vero se X<Y, X> e Y>0"

Dato che la precondizione è inconsistente, questo equivale a dire che A(X,Y) non è dimostrato

Valutazione bottom-up

Quello che si ottiene è un insieme di clausole del tipo:

letterale ← vincoli

Si parte trasformando in questo formato ogni clausola che contiene solo vincoli nel corpo

Nel passo generico, si considerano tutte le clausole testa :- corpo in cui tutti i letterali del corpo sono nell'insieme di sopra

Si considerano insieme: i vincoli del corpo, i vincoli dei letterali, i vincoli di uguaglianza che derivano

Si aggiunge testa ← vincoli all'insieme, dove i vincoli sono quelli dei tre tipi di sopra

Ripetizione

La valutazione bottom-up può sempre portare a delle ripetizioni:

A(0).
A(X):-X>0.
A(X):-X=Y+1,A(Y).

Qui si ottiene subito A(0) e A(X) ← X>0

Se si seguono le regole di sopra, si vede che da A(0) e da A(X):-X=Y+1,A(Y). si deriva A(1)

Usando la stessa clausola, si deriva A(2), poi A(3), ecc.

Però queste sono tutte conseguenze di A(X) ← X>0 (che implica che A(X) vale per ogni valore di X maggiore di zero

Per evitare la ripetizione:

si normalizzano in vincoli (in modo tale che X>0 sia lo stesso che 0<X)
si controlla che i vincoli che vengono aggiunti non siano conseguenze di quelli già presenti

La seconda cosa si può fare (parzialmente) creando il vincolo "opposto" (quello che è soddisfatto da tutti i valori che violano l'altro) e verificando se è consistente con il resto