Traduci

COME DIFENDERE I DATI PERSONALI DAL WEB SCRAPING – Le indicazioni del Garante Privacy

Il web scraping è la raccolta automatica e indiscriminata di dati da internet, spesso utilizzata per addestrare modelli di Intelligenza Artificiale Generativa (IAG). Si tratta, in buona sostanza, di una tecnica informatica finalizzata a estrarre dati dalle pagine dei siti web. Tali dati, una volta  classificati  e suddivisi  per categorie, vengono  raccolti in database o tabelle per essere analizzati. Il web scraping (notoriamente utilizzato , ad esempio, dai motori di ricerca come Google) può avere anche risvolti illeciti come la sottrazione di dati sensibili per phishing, furti di identità o attacchi informatici (come il DDoS, Distributed Denial of Service) ovvero per  raccogliere dati personali al fine di addestrare algoritmi di intelligenza artificiale generativa (IAG).

E’ proprio per tale potenziale illecito  che il Garante privacy ha pubblicato le indicazioni per difendere i dati personali pubblicati online da soggetti pubblici e privati in qualità di titolari del trattamento dal web scraping, la raccolta indiscriminata di dati personali su internet, effettuata, da terzi, con lo scopo di addestrare i modelli di Intelligenza artificiale generativa (IAG).

Il provvedimento, consultabile sul sito www.gpdp.it, è stato pubblicato sulla Gazzetta Ufficiale Serie Generale n. 132 del 7 giugno 2024 tiene conto dei contributi ricevuti dall’Autorità nell’ambito dell’indagine conoscitiva, deliberata lo scorso dicembre.

Il Garante per la protezione dei dati personali aveva  avviato una indagine conoscitiva sui siti internet pubblici e privati per verificare l’adozione di idonee misure di sicurezza adeguate ad impedire la raccolta massiva (webscraping) di dati personali a fini di addestramento degli algoritmi di intelligenza artificiale (IA) da parte di soggetti terzi.

In attesa di pronunciarsi, all’esito di alcune istruttorie già avviate tra le quali quella nei confronti di OpenAI, sulla liceità del web scraping di dati personali effettuato sulla base del legittimo interesse, l’Autorità ha ritenuto necessario fornire a quanti pubblicano online dati personali in qualità di titolari del trattamento talune prime indicazioni sull’esigenza di compiere alcune valutazioni in ordine all’esigenza di adottare accorgimenti idonei a impedire o, almeno, ostacolare il web scraping.

Nel documento l’Autorità suggerisce alcune tra le misure concrete da adottare: la creazione di aree riservate, accessibili solo previa registrazione, in modo da sottrarre i dati dalla pubblica disponibilità; l’inserimento di clausole anti-scraping nei termini di servizio dei siti; il monitoraggio del traffico verso le pagine web per individuare eventuali flussi anomali di dati in entrata e in uscita; interventi specifici sui bot utilizzando, tra le altre, le soluzioni tecnologiche rese disponibili dalle stesse società responsabili del web scraping.

Si tratta di misure non obbligatorie che i titolari del trattamento dovranno valutare, sulla base del principio di accountability, se mettere in atto per prevenire o mitigare, in maniera selettiva, gli effetti del web scraping, in considerazione di una serie di elementi: lo stato dell’arte tecnologico; i costi di attuazione, in particolare per le PMI.

Data:

6 Luglio 2024

Lascia un commento

Il tuo indirizzo email non sarà pubblicato. I campi obbligatori sono contrassegnati *