OpenAI lanza el monitoreo de CoT para detener el comportamiento malicioso de los modelos grandes

2025-03-10 22:48:31

Generación de resúmenes en curso

Golden Finance informó que OpenAI publicó la última investigación, utilizando el monitoreo de CoT (cadena de pensamiento), puede prevenir comportamientos maliciosos como modelos grandes que dicen tonterías y ocultan verdaderas intenciones, y también es una de las herramientas efectivas para supervisar a los supermodelos. OpenAI utiliza el modelo de última generación o3-mini recientemente lanzado como objeto monitoreado, y el modelo GPT-4o más débil como monitor. El entorno de prueba es una tarea de codificación que requiere que la IA implemente la funcionalidad en el código base para superar las pruebas unitarias. Los resultados mostraron que el monitor CoT tuvo un buen desempeño en la detección de comportamientos sistemáticos de "piratería de recompensas", con una tasa de recuerdo de hasta el 95%, superando con creces el 60% de los comportamientos que solo se monitorearon.

GPT-2.33%

Ver originales

Esta página puede contener contenido de terceros, que se proporciona únicamente con fines informativos (sin garantías ni declaraciones) y no debe considerarse como un respaldo por parte de Gate a las opiniones expresadas ni como asesoramiento financiero o profesional. Consulte el Descargo de responsabilidad para obtener más detalles.

Recompensa
Me gusta
Comentar
Compartir

Comentar

0/400

Sin comentarios

Tema
Gate 2025 Q2 Report Released
1904 Popularidad
Gate Derivatives Volume Hits New High
4327 Popularidad
CPI Data Incoming
2307 Popularidad
4Join Gate VIP to Win MacBook
29439 Popularidad
5MicroStrategy Buys More Bitcoin
496 Popularidad
6BTC Hits New High
93223 Popularidad
7My Gate Moments
26234 Popularidad
8VIP Exclusive Airdrop Carnival
25187 Popularidad
9Fed June Meeting Minutes
6045 Popularidad
10Gate Alpha Trading Share
13511 Popularidad

Anclado