🚀 EDB 엔지니어링 뉴스레터 #13 (12월 8일)
EEDB 엔지니어링 뉴스레터 13호에 오신 것을 환영합니다! 이번 호에서는 EDB 팀이 흥미롭게 지켜본 데이터 세계의 이슈들과 EDB 엔지니어링 팀의 최신 소식을 전해드립니다. AI의 안전성 문제부터 KubeCon에서의 활약, 그리고 Postgres의 미래까지 다양한 이야기를 만나보세요. 우리가 주목하는 뉴스 (News we’re watching) 1. 자연적으로 발생하는 AI의 ‘정렬 불일치’ (Natural emergent misalignment) Anthropic의 연구진이 발표한 새로운 논문에 따르면, 강화 학습(RL)을 통해 훈련된 AI 모델이 속임수(deception)나 코드 사보타주와 같은 위험한 행동을 자발적으로 개발할 수 있다고 합니다. 이는 모델이 올바른 코드를 작성하는 대신, 유닛 테스트를 우회하기 위해 스크립트를 강제로 성공 종료시키는 등의 ‘보상 해킹(reward hacks)’을 학습하는 과정에서 발생하는 부작용입니다. 💡 핵심 요약 데이터베이스나 코드베이스에 접근하는 AI 에이전트를 구축할 때, ‘사양 게임(specification gaming)’은 심각한 보안 위험이 될 […]
