Il meccanismo cognitivo dellesperto spesso fa riferimento a
regole empiriche acquisite dalla propria esperienza, e a dati che non sono certi o
completi. Egli è capace di ragionare anche quando le informazioni disponibili sono
incerte o incomplete. Le conclusioni così ottenute, non sono assolutamente corrette. Esse
si basano su conoscenze ritenute generalmente vere, e sono frutto di un
ragionamento approssimato. Inoltre sono suscettibili di cambiamenti, in quanto
larrivo di nuovi elementi di informazione, potrebbe far cambiare opinione
allesperto. Gli schemi di rappresentazione della conoscenza visti nel precedente
capitolo non sempre si adattano bene quando la conoscenza da rappresentare risulta incerta
e incompleta. Si pensi ad esempio alla difficoltà che si incontra, utilizzando un
linguaggio predicativo, a rappresentare affermazioni contenenti aggettivi il cui
significato è soggettivo, come ad esempio "Richard è alto", "Lacqua
è fredda", oppure affermazioni che contengono implicitamente un quantificatore
universale giustificato dal buon senso, tipo "Le persone alte di solito giocano a
basket". In questo capitolo illustreremo alcune tra le più comuni tecniche di rappresentazione e manipolazione della conoscenza incerta e incompleta allo scopo di focalizzare lattenzione del lettore sulle differenze tra i diversi tipi di ragionamento e sulle problematiche affrontate, in modo da chiarire le scelte che verranno adottate nel lavoro sperimentale oggetto di questa tesi. La tecnica dei Certainty Factors è stata
introdotta nel 1972, nel sistema esperto MYCIN. [Sh76] [Da77] [Bu84] Tale sistema
diagnostica, e propone terapie, nel campo delle infezioni batteriche da curare con
antibiotici. La base di conoscenza è rappresentata mediante tre strutture dati: una
struttura dati statica; una struttura dati dinamica; un insieme di regole di produzione. IF "La conformazione di crescita del microrganismo è a
catena" Il verificarsi delle tre premesse, solitamente implica che il
microrganismo è uno streptococco. Talvolta però, nellesperienza dellesperto,
tale conclusione è risultata falsa. Per tale motivo, date le premesse, lesperto
crede fortemente nella conclusione, ma non esclude la possibilità che sia falsa. "La conformazione di crescita del microrganismo è a
catena" 0.8 Per calcolare il fattore di certezza complessivo da associare ad una regola, tenendo conto dei fattori di certezza delle premesse, si usa la seguente regola: Sia P = max(0, min(fattori di certezza associati
alle premesse) ), e R il fattore di certezza associato alla regola. Il fattore di certezza
totale associato alla conclusione è Lidea è che una regola deve cercare di rafforzare la conclusione. Ad esempio, se la conformazione di crescita del microrganismo non è a catena "La conformazione di crescita del microrganismo è a catena" - 0.9 non implica che lorganismo non è streptococco. Se così
fosse andrebbe aggiunta unaltra regola per contemplare tale caso. Cf12 = Cf1 + Cf2 ( 1 - Cf1
) se Cf1 > 0 e Cf2 > 0 Il processo di inferenza, tra le altre cose, utilizzando le regole
suddette, propaga lincertezza dai dati iniziali alle conclusioni, proponendo le
soluzioni unite al proprio fattore di certezza. Un inference network o rete
inferenziale è un grafo aciclico diretto (DAG), in cui linsieme dei vertici V
corrisponde allinsieme delle proposizioni derivanti dalla base di conoscenza e la
relazione di adiacenza E corrisponde alla relazione di implicazione tra esse.
Figura A Un sottoinsieme semplificato di regole del sistema esperto PROSPECTOR
Figura B Rete inferenziale associata alle regole di figura a Tra i diversi metodi progettati per propagare
lincertezza in una rete la nostra attenzione ricade sui cosiddetti "Bayesian
Belief Networks", o anche "Causal Networks" [Mi76] [Ne90]. In
tali approcci gli archi tra i vertici del grafo rappresentano relazioni di causa-effetto,
e lincertezza viene trattata mediante il calcolo delle probabilità. 1. P(E) ³ 0 "
E Î F La tripla (W , F, P) rappresenta uno spazio
di probabilità. W = { X1 Ù X2 Ù ... Ù Xn} , che rappresenta linsieme di tutte le intersezioni dei possibili valori di X1 ... Xn ed F = insieme delle parti di W. La distribuzione di probabilità (W, F, P) viene detta distribuzione di probabilità congiunta di { X1, X2, ..., Xn }Sia inoltre V un insieme finito di variabili proposizionali definite sullo stesso spazio di probabilità, sia (W, F, P) la loro distribuzione di probabilità congiunta, e sia infine G = (V, E) un grafo aciclico diretto. Individuiamo: " v Î
V ® c(v) Í V (insieme dei
predecessori di v); La tripla (V, E, P) è un causal network se " W Í a(v),
W e v sono indipendenti dato c(v), o in altre parole
Figura C Esempio di Bayesian Belief Network. Alla rete è poi associata una distribuzione di probabilità congiunta P(V). La difficoltà maggiore che si incontra nel costruire un Bayesian Belief Network, è la notevole complessità a determinare la distribuzione di probabilità congiunta, evidenziata in particolar modo quando le variabili proposizionali derivanti dalla base di conoscenza sono numerose (con N variabili proposizionali abbiamo 2N assegnazioni). La potenza di un Bayesian Belief Network è data dal seguente teorema - Se C = (V, E, P) è un causal network, allora
ciò significa che conoscendo la distribuzione di probabilità
condizionata di ogni variabile proposizionale dati i suoi predecessori, è possibile
calcolare la distribuzione di probabilità congiunta di tutte le variabili proposizionali
della rete. In questo modo la complessità a determinare la distribuzione di probabilità
congiunta, viene ridotta enormemente. - Determinare la distribuzione di probabilità congiunta delle variabili proposizionali; - Calcolare la distribuzione di probabilità condizionata, avendo assegnato dei valori a certe variabili. Nella prima fase, lesperto assume un ruolo predominante. Deve
identificare le relazioni di causa-effetto e le relazioni di indipendenza statistica tra
le variabili proposizionali, e dare la corretta distribuzione di probabilità.
Tale approccio ben si addice a domini rappresentabili come un insieme
di relazioni di causa-effetto tra gli elementi, quali ad esempio elettronica (diagnosi di
circuiti), meccanica (ricerca dei guasti in unautomobile), ecc. Il ragionamento qualitativo vuole essere
unalternativa agli approcci probabilistici appena visti. Il pensiero che cè
alla base è la convinzione che la conoscenza dellesperto non è strutturata in una
serie di informazioni associate a delle probabilità, e che le decisioni che prende non
sono frutto di calcoli di probabilità, bensì egli, preso atto di alcune evidenze, cerca,
tra le altre, lipotesi che meglio le spiega, senza dare un giudizio rigoroso, e
quindi un valore numerico, sulla propria convinzione riguardo la decisione presa. Egli si
limita a dare una lista delle ipotesi, ordinata in ordine decrescente di plausibilità,
che potrebbero spiegare le evidenze. Tale meccanismo di ragionamento viene chiamato:
"ragionamento abduttivo". [Yu90] - Deduzione: regola data: A Þ B , fatto verificato: A, risultato ottenuto: B Es. - Induzione: fatto dato: A, risultato verificato: B, regola ipotizzata A Þ B Es. - Abduzione: regola data: A Þ B, fatto verificato: B, fatto ipotizzato A Es. Linduzione e labduzione richiedono ulteriori evidenze che confermino lipotesi, mentre la deduzione è una conseguenza logica dei fatti e ci porta da fatti veri, a fatti veri. Il ragionamento abduttivo viene utilizzato in un motore inferenziale nel seguente modo: - la base di conoscenza è composta da regole del tipo A Þ B; - l osservazione del mondo genera una serie di evidenze (B, E, Q, ...) - Se nella base di conoscenza è presente una regola A Þ B, ed è presente tra le evidenze B, allora lipotesi esplicativa A viene rafforzata, o, se non era ancora stata intrattenuta, viene generata. In questo modo, sulla base di tutte le evidenze, viene generata una
lista di ipotesi, ordinata in funzione della forza associata a ciascuna di esse. Diremo
allora che: lipotesi in testa sembra essere la più plausibile; la seconda, se
esiste, potrebbe anche spiegare le evidenze, e così via. Si noti come, in tal modo, non
viene dato un valore numerico alla credibilità di una ipotesi, ma solo un giudizio
qualitativo relativo alle ipotesi che sembrano spiegare le evidenze. 1. Evocazione delle ipotesi: Osservate un certo numero di evidenze iniziali, mediante abduzione vengono estratte le ipotesi esplicative. Si forma in questo modo una lista ordinata di ipotesi in competizione. 2. Test delle ipotesi: vengono generate le domande idonee a rafforzare o eventualmente ad indebolire le ipotesi in competizione. 3. Aggiornamento dellinsieme delle ipotesi: le risposte alle domande di test generano nuove evidenze, che vengono utilizzate, mediante abduzione, per aggiornare linsieme delle ipotesi in competizione, o per generarne di nuove. La lista aggiornata sarà sempre ordinata in base ad un indice di plausibilità.
Figura D Ciclo di generazione, test ed aggiornamento delle ipotesi, detto anche ciclo abduttivo-deduttivo. Il ciclo di generazione, test ed aggiornamento delle ipotesi
continua fino a quando la plausibilità di una o più ipotesi viene decisa mediante un
euristica. Tale tipo di ragionamento appartiene alla categoria dei ragionamenti non
monotoni [Mc80], in quanto le conclusioni raggiunte possono essere ritrattate, in seguito
allarrivo di informazioni discordanti. - Come esprimere la plausibilità delle ipotesi ? - Quando un ipotesi è da considerare plausibile ? - Come scegliere le domande di test ? [Hi83] Una soluzione al primo problema potrebbe essere ad esempio quella di
esprimere la plausibilità di un ipotesi in funzione del numero di evidenze ad essa legate
e della loro qualità (evidenza molto importante, poco importante, ecc). |