Perspectives innovadores en el disseny d’algoritmes intel·ligents per a la classificació d’obres d’art: eines per a una millor integració humà-màquina
La classificació de pintures segons el seu estil artístic utilitzant algoritmes és un tema de recerca extensament tractat al món de la intel·ligència artificial. La major part d’aquesta recerca utilitza tècniques d’aprenentatge automàtic (en anglès, machine learning), on els algoritmes són dissenyats a partir de, per exemple, xarxes neuronals, aprenentatge profund o màquines de vectors de suport. Aquest tipus de treballs donen bons resultats, amb graus d’encert d’entorn el 75%, però també presenten desavantatges. Sovint aquests algoritmes no treballen amb unitats ni operacions que estiguin predefinides pels dissenyadors, generant situacions on no es pot fer un seguiment explícit del perquè dels seus resultats. Endemés, necessiten entrenar amb amplis bancs de dades que requereixen un fort treball de tractament d’informació previ.
El treball que presentem ha estat realitzat per investigadors de la Universitat Autònoma de Barcelona, l’Institut d’Investigació en Intel·ligència Artificial del CSIC, la Barcelona Graduate School of Mathematics i el Bremen Spatial Cognition Center (Universitat de Bremen). Buscant una perspectiva que millori la integració humà-màquina i eviti les complicacions explicades abans, els autors han dissenyat un algoritme classificador de pintures segons el seu estil artístic fent servir representació lògica i conceptes qualitatius de color. El resultat és ℓ-SHE (ℓogical Style painting classifier based on Horn clauses and Explanations), un algoritme en el qual les unitats de treball i les operacions tenen un contingut semàntic i representatiu que està fet a “mida humana”, permetent interpretacions i explicacions dels resultats classificatoris, tot requerint un entrenament relativament senzill.
Els estils artístics escollits per a l’experiment són el barroc, l'impressionisme i el postimpressionisme. Tot seguint avaluacions expertes que defensen que cada estil té trets de color definitoris, i usant un model qualitatiu de color —definit a partir d'un sistema de referència de colors que ha estat calibrat segons com els humans distingeixen to, saturació i lluminositat—, els autors han definit les nocions difuses dels trets de color més característics per a cada estil. El disseny de ℓ-SHE està basat en tres evaluated Horn clauses (fórmules definides en un llenguatge proposicional expandit amb constants racionals), cadascuna representant un estil. Així, per exemple, d'acord amb aquesta proposta una pintura del barroc mostrarà una combinació de freqüències de colors obscurs i amb poca lluminositat, alhora que també presentarà un contrast notori entre colors obscurs i clars, mentre que és característic del postimpressionisme presentar una alta freqüència de colors vívids i càlids, etc.
Després de calibrar ℓ-SHE utilitzant la base de dades QArt-Dataset (amb 90 pintures), la classificació obtinguda no supera als millors algoritmes dissenyats amb tècniques d'aprenentatge automàtic, ja que la millor versió de ℓ-SHE obté 73.3% d'encert per al QArt-Dataset i 60.2% d'encert per al Painting-91-BIP (amb 257 pintures). No obstant això, els resultats no són menyspreables, i apunten cap a una nova perspectiva de disseny d'algoritmes on l'encert no és l’òptim, però sí que pot ser satisfactori, i on la interacció i la possibilitat d’aportar explicacions guanyen terreny com a factors clau.
Oriol Roca-Martín1, Vicent Costa1, Maria Pilar Dellunde1, 2, 3 i Zoe Falomir4
1Universitat Autònoma de Barcelona.
2Institut d'Investigació en Intel·ligència Artificial del CSIC.
3Barcelona Graduate School of Mathematics.
4Bremen Spatial Cognition Center. Universität Bremen.
Referències
Costa, V., Dellunde, P., Falomir, Z., (2019). The logical style painting classifier based on Horn clauses and explanations (ℓ-SHE). Logic Journal of the IGPL, publicat en xarxa (novembre 2019): https://doi.org/10.1093/jigpal/jzz029