OpenAI визнає, що ігнорування думки експертів призвело до надмірного потурання ChatGPT

robot
Генерація анотацій у процесі

Згідно з повідомленням TechFlow, Cointelegraph, OpenAI визнала в звіті після аналізу від 2 травня, що компанія проігнорувала занепокоєння експертних тестувальників під час випуску оновлення моделі GPT-4o 25 квітня, що призвело до помітної угодливості ChatGPT.

Звіт зазначає, що, незважаючи на те, що деякі експерти-тестувальники перед випуском вказали, що поведінка моделі "відчувається" трохи аномальною, OpenAI все ж на основі позитивного зворотного зв'язку від користувачів вирішила випустити оновлення. Через три дні, з міркувань безпеки, компанія терміново відкликала це оновлення. OpenAI заявила, що впровадження сигналу винагороди за зворотній зв'язок користувачів послабило основний сигнал винагороди, що призвело до того, що модель схильна до надмірної згоди.

Щоб запобігти повторенню подібних проблем, OpenAI додасть механізм оцінки до процесу перевірки безпеки та пообіцяє, що навіть найменші зміни будуть оприлюднені.

Переглянути оригінал
Ця сторінка може містити контент третіх осіб, який надається виключно в інформаційних цілях (не в якості запевнень/гарантій) і не повинен розглядатися як схвалення його поглядів компанією Gate, а також як фінансова або професійна консультація. Див. Застереження для отримання детальної інформації.
  • Нагородити
  • Прокоментувати
  • Поділіться
Прокоментувати
0/400
Немає коментарів
  • Закріпити