Nawet po szkoleniu antyrasistowskim chatboty AI, takie jak ChatGPT, nadal wykazują uprzedzenia rasowe

Naukowcy twierdzą, że twórcy LLM, tacy jak OpenAI, muszą dokładniej sprawdzać swoje SI pod kątem "ukrytego rasizmu". (Zdjęcie: OpenAI)

Naukowcy odkryli, że chatboty AI, takie jak ChatGPT-4, mogą nadal generować rasistowskie uprzedzenia nawet po szkoleniu w zakresie bezpieczeństwa. Badanie podkreśla potrzebę większej ostrożności i weryfikacji pod kątem "ukrytych uprzedzeń", zanim LLM zostaną udostępnione publicznie.

Sanjiv Sathiah (tłumaczenie Ninh Duy), Opublikowany 11/03/2024 🇺🇸 🇫🇷 ...

AI Science

Naukowcy, którzy testowali chatboty AI oparte na dużych modelach językowych, takich jak Chat GPT4 OpenAI, odkryli, że mogą one nadal wykazywać uprzedzenia rasowe, nawet po przejściu szkolenia antyrasistowskiego. Najnowsze odkrycie nastąpiło po niedawnym projekcie Google Gemini AI po tym, jak jej nowy LLM został nadmiernie skorygowany pod kątem rasizmugenerując to, co niektórzy nazywali "obudzonymi" reinterpretacjami historii, w których na przykład Afroamerykanie byli przedstawiani jako nazistowscy żołnierze z II wojny światowej. Wydaje się, że uzyskanie właściwej równowagi w kwestii rasy okazuje się trudne dla twórców modeli LLM.

W najnowszym badaniu, podkreślonym przez New Scientist, naukowcy odkryli, że dziesiątki różnych modeli LLM, które testowali, nadal wykazywały uprzedzenia rasowe, gdy prezentowano tekst przy użyciu dialektów afroamerykańskich. Działo się tak pomimo tego, że testowane modele zostały specjalnie przeszkolone, aby uniknąć uprzedzeń rasowych w odpowiedziach udzielanych przez chatboty. Obejmuje to model OpenAI ChatGPT-4 i GPT-3.5. W jednym przypadku GPT-4 okazał się bardziej skłonny do rekomendowania wyroku śmierci, jeśli mówi po angielsku z dialektem afroamerykańskim.

To samo "ukryte uprzedzenie" było również widoczne w rekomendacjach dotyczących pracy, które dopasowywały Afroamerykanów do zawodów, które rzadziej wymagały stopnia naukowego lub posuwały się nawet do kojarzenia osób pochodzenia afroamerykańskiego bez pracy, w porównaniu ze standardowymi danymi wejściowymi opartymi na amerykańskim angielskim. Naukowcy odkryli również, że im większy model językowy, tym większe prawdopodobieństwo, że będzie on wykazywał te podstawowe uprzedzenia. Badanie budzi obawy dotyczące wykorzystania technologii generatywnej sztucznej inteligencji do celów przesiewowych, w tym przeglądania podań o pracę.

Naukowcy doszli do wniosku, że ich badanie rodzi pytania dotyczące skuteczności interwencji szkoleniowych w zakresie bezpieczeństwa opartych na sztucznej inteligencji, które wydają się usuwać rasizm i uprzedzenia tylko na wysokim poziomie, ale mają trudności z wykorzenieniem ich z obecnych modeli na niższym poziomie, gdzie konkretna terminologia określająca tożsamość rasową nie jest wymieniana podczas wprowadzania danych przez użytkowników. Naukowcy zalecają, aby firmy opracowujące LLM były ostrożne przy publicznym udostępnianiu chatbotów LLM, zanim zostaną one dokładnie zweryfikowane.

Źródło(a)

New Scientist [sub. req.]

Powiązane artykuły

Już wkrótce fani będą mogli ponownie zobaczyć Scarlett Johansson na dużym ekranie. Jej nowy dramat-komedia "Fly Me to the Moon" wejdzie na ekrany amerykańskich kin 12 lipca. (Źródło: OpenAi)

Scarlett Johansson kontra OpenAI: Asystent AI ChatGPT "Sky" ma wykorzystywać głos Johansson bez jej zgody 21/05/2024

V1 to nowy smartwatch od Rogbid. (Zdjęcie: Rogbid)

Wodoodporny smartwatch Rogbid V1 z dużym wyświetlaczem AMOLED i baterią, a także ChatGPT w znacznie obniżonej cenie 29/04/2024

Nothing OS 2.5.5 dla Nothing Phone 2 integruje ChatGPT (źródło obrazu: Nothing)

Nowa aktualizacja Nothing OS wprowadza ChatGPT do Nothing Phone 2 20/04/2024

Kolejna iteracja GPT LLM od OpenAI jest już za kilka miesięcy. (Zdjęcie: OpenAI)

ChatGPT-5 jest podobno na dobrej drodze do letniej premiery 20/03/2024

Procesory graficzne Nvidia H100 Tensor Core (źródło obrazu: Nvidia Corp)

Nvidia buduje nową jednostkę, aby dostarczać ChatGPT, Microsoft, Google i Meta niestandardowe chipy AI 11/02/2024

Właściciele Vision Pro mogą teraz korzystać z ChatGPT (Źródło obrazu: Apple)

Aplikacja ChatGPT jest już dostępna dla Apple Vision Pro 07/02/2024

Pictory GPT for Videos dostępne dla ChatGPT Plus (Źródło: Własne)

Pictory GPT for Videos wprowadza oparte na sztucznej inteligencji tworzenie wideo do ChatGPT 06/02/2024

ChatGPT's OpenAI zamierza pozyskać nowe finansowanie przy wycenie 100 mld USD 25/12/2023

Wykorzystanie sztucznej inteligencji ma duży ślad węglowy (symboliczny obraz: Bing AI)

Obraz AI zużywa tyle energii, co ładowanie telefonu - czy ChatGPT i spółka są szkodliwi dla klimatu? 20/12/2023

Urtopia Fusion: Rower elektryczny z potężnym wsparciem AI

Urtopia Fusion: E-bike ma przenieść rowery do następnej generacji dzięki AI, ChatGPT i LTE 11/12/2023

Meta i inni giganci technologiczni tworzą sojusz AI, aby przeciwdziałać ChatGPT 05/12/2023

ChatGPT, Character AI i Google Bard dominują w globalnym krajobrazie sztucznej inteligencji 02/12/2023

27-calowy monitor do gier ViewSonic...

Wyniki testów porównawczych Snapdra...

Editor of the original article: Sanjiv Sathiah - Senior Tech Writer - 1467 articles published on Notebookcheck since 2017

contact me via: @t3mporarybl1p

Translator: Ninh Ngoc Duy - Editorial Assistant - 522633 articles published on Notebookcheck since 2008

contact me via: Facebook

Please share our article, every link counts!

> laptopy testy i recenzje notebooki > Nowinki > Archiwum v2 > Archiwum 2024 03 > Nawet po szkoleniu antyrasistowskim chatboty AI, takie jak ChatGPT, nadal wykazują uprzedzenia rasowe

Sanjiv Sathiah, 2024-03-11 (Update: 2024-03-11)