Bekanntlich müssen KI-Modelle mit einer Unmenge an Daten trainiert werden. Mittlerweile hört man immer öfter Berichte von einem Datenmangel in der KI-Branche. Zuletzt ist in der New York Times ein Artikel mit dem bezeichnenden Titel "The Data That Powers A.I. Is Disappearing Fast" erschienen. Danach soll die Datenbeschaffung insbesondere durch Web-Scraping, also dem Absaugen von Inhalten aus dem Internet, laufend schwieriger werden. Immer mehr Webseitenbetreiber verwehren sich dieser Praxis und wollen ein Abschöpfen ihrer Daten nicht so einfach zulassen. Das kann nicht nur die großen Anbieter von Modellen generativer KI treffen, sondern auch weniger etablierte Player und Start-ups. Deren Anwendungen basieren oft auf bekannten KI-Modellen. Auch ein Aufschließen zu den Großen wird dadurch schwieriger.