Ny forskning tyder på att innehåll från kinesiska statliga medier är djupt integrerat i de datauppsättningar som används för att träna stora system för artificiell intelligens (AI). Forskarna tror att det kan påverka hur vissa modeller svarar på politiskt känsliga frågor.
En studie som publicerades i den vetenskapliga tidskriften Nature den 13 maj visade att stora mängder material från kinesiska statliga medier – däribland nyhetsbyrån Nya Kina (Xinhua) och Folkets dagblad – förekommer i träningsdatan för de så kallade stora språkmodellerna (LLM).
Enligt forskningen var det mer sannolikt att flera ledande AI-system – däribland Chat GPT, Claude och Googles Gemini – genererade svar som låg nära den officiella kinesiska regimens position när de fick frågor på kinesiska om ämnen relaterade till Kinas politiska system eller känsliga inrikesfrågor. Studien fann att engelskspråkiga svar på samma frågor ofta skilde sig åt i ton eller betoning.













