PromptEngineering

Descrizione del Progetto

Progetto di tesi triennale focalizzato sull'analisi e valutazione di modelli Vision-Language (VLM) nella classificazione di volti reali vs. generati artificialmente. Il lavoro esplora diverse strategie di prompt engineering e tecniche di few-shot learning per ottimizzare le prestazioni dei modelli nella discriminazione tra immagini autentiche e sintetiche.

Obiettivi

Valutare l'efficacia di diverse tipologie di prompt nella classificazione di volti
Confrontare le performance di modelli multimodali (LLaVA, Gemma3, Qwen2.5-VL)
Analizzare l'impatto del prompt engineering su accuratezza e bias
Studiare le differenze tra prompt in inglese e italiano
Implementare e testare tecniche di one-shot learning

Dataset

140K Real and Fake Faces (Kaggle)

150 immagini di volti reali
150 immagini di volti generati artificialmente
Dataset bilanciato per garantire equità nella valutazione

Modelli Testati

Tutti i modelli sono disponibili sia in formato Ollama che Hugging Face:

LLaVA 7B - Large Language and Vision Assistant
Gemma3 4B - Modello multimodale di Google
Qwen2.5-VL 3B/7B - Qwen Vision-Language Models

Tipologie di Prompt

Il progetto implementa 7 prompt organizzati in 3 categorie:

Neutri (0, 1, 3): Domande dirette senza bias
Orientati "Real" (4, 5): Bias verso classificazione reale
Orientati "Fake" (2, 6): Focus su artefatti e immagini generate

Ogni prompt è disponibile in inglese e italiano.

Struttura del Progetto

PromptEngineering/
│
├── classifier.py          # Logica di classificazione
├── dataset.py            # Gestione dataset
├── main.py               # Script principale
├── metrics.py            # Calcolo metriche
├── plot.py               # Visualizzazioni
├── prompt.py             # Definizione prompt
│
├── resultsJSON/          # Risultati esperimenti
├── plots/                # Grafici e visualizzazioni
└── README.md

Utilizzo

Esecuzione Base

python main.py

Configurazione Parametri

# Dataset
NAME = "test_OS"              # Nome dataset
MAX_IMAGES = 300              # Numero immagini

# Prompt
INDEX_PROMPT = 6              # Tipo prompt (0-6)
IS_ITALIAN = False            # Lingua
UNCERTAIN_EN = True           # Abilita opzione "uncertain"

# Modello
MODEL_NAME = "gemma3:4b"      # Modello da usare

# One-Shot
ONESHOT = True                # Abilita esempio one-shot

Modalità Automatica

AUTO_ON = True  # Esegue tutti gli esperimenti

Metriche Calcolate

Accuracy, Precision, Recall
F1-Score e F2-Score
One-class Accuracy (per classe separata)
Rejection Rate (frequenza risposte incerte)
False Positive/Negative Rate
Confusion Matrix

Analisi e Visualizzazioni

import plot

# Confronto prompt
plot.plotStatsPrompt("JsonMeanStats/Sure/gemma3")

# Confronto ENG vs ITA
plot.graphLangAvg("llava", metrics=["accuracy", "precision", "recall"])

# Visualizzazione t-SNE
plot.plot_tsne_prediction_with_errors("path/to/results.json", "gemma3")

# Clustering incertezze
plot.visualize_cluster_uncertain("path/to/results.json", "gemma3", "Prompt-0")

Per analisi dettagliate, grafici completi e discussione dei risultati, consultare il report di tesi.

Output

Ogni esperimento genera:

File JSON con metriche e risposte dettagliate
Grafici comparativi (bar chart, confusion matrix)
Visualizzazioni embeddings (t-SNE, PCA)
Analisi cluster per risposte incerte

Limitazioni

Dataset limitato a 300 immagini per esperimento
Focus su volti frontali in condizioni standard
Vincoli computazionali per esecuzione locale

Sviluppi Futuri

Espansione a dataset più ampi
Test su condizioni di illuminazione variabili
Integrazione modelli più recenti (GPT-4V, Claude)
Analisi video e sequenze temporali

Licenza

Mit

Name		Name	Last commit message	Last commit date
Latest commit History 38 Commits
.idea		.idea
JsonMeanStats		JsonMeanStats
KaggleProject		KaggleProject
__pycache__		__pycache__
analysis_results		analysis_results
photoEx		photoEx
plots		plots
promptSection		promptSection
report		report
resultsJSON		resultsJSON
test_1		test_1
test_2		test_2
test_3		test_3
test_OS		test_OS
.gitignore		.gitignore
LICENSE		LICENSE
README.md		README.md
classifier.py		classifier.py
dataset.py		dataset.py
detector.modelfile		detector.modelfile
main.py		main.py
metrics.py		metrics.py
plot.py		plot.py
prompt.py		prompt.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

PromptEngineering

Descrizione del Progetto

Obiettivi

Dataset

Modelli Testati

Tipologie di Prompt

Struttura del Progetto

Utilizzo

Esecuzione Base

Configurazione Parametri

Modalità Automatica

Metriche Calcolate

Analisi e Visualizzazioni

Output

Limitazioni

Sviluppi Futuri

Licenza

Riferimenti

About

Uh oh!

Releases

Packages

Uh oh!

Contributors

Uh oh!

Languages

License

Pennelli02/PromptEngineering

Folders and files

Latest commit

History

Repository files navigation

PromptEngineering

Descrizione del Progetto

Obiettivi

Dataset

Modelli Testati

Tipologie di Prompt

Struttura del Progetto

Utilizzo

Esecuzione Base

Configurazione Parametri

Modalità Automatica

Metriche Calcolate

Analisi e Visualizzazioni

Output

Limitazioni

Sviluppi Futuri

Licenza

Riferimenti

About

Topics

Resources

License

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Contributors

Uh oh!

Languages

Packages