Bits, Bytes and Neural Networks

LLaMA: Open and Efficient Foundation Language Models

TL;DR 이 연구를 시작하게 된 배경과 동기는 무엇입니까? 대규모 언어 모델(LLM)의 발전은 주로 비공개 데이터셋과 막대한 컴퓨팅 자원을 보유한 대기업들에 의해 주도되어 왔습니다. 이는 학계와 소규모 연구 기관들의 LLM 연구 참여를 제한하는 중요한 장벽이 되어왔습니다. 메타 AI 연구진은 이러한 한계를 극복하고자, 공개적으로 접근 가능한 데이터만을 사용하여 최고 수준의 성능을 달성할...

February 27, 2023

in Paper Reviews, Language Models

Constitutional AI: Harmlessness from AI Feedback

TL;DR 이 연구를 시작하게 된 배경과 동기는 무엇입니까? AI 시스템의 능력이 인간 수준에 도달하거나 이를 초과하는 상황에서 이들을 유용하고, 정직하며, 무해한 상태로 유지하는 것은 AI 안전성 연구의 핵심 과제입니다. 기존의 인간 피드백으로부터의 강화 학습(RLHF) 방법은 수만 개의 인간 레이블을 필요로 하며, 이는 상당한 비용과 시간을 소모합니다. 더욱이 이전 연구에서는 무해성과...

December 15, 2022

in Paper Reviews, Finetuning