PaLM
PaLM(Pathways Language Model)은 Google AI에서 개발한 5400억 개의 파라미터 변환기 기반 대규모 언어 모델이다.[1] 연구원들은 또한 모델 규모의 효과를 테스트하기 위해 더 작은 버전의 PaLM, 80억 및 620억 파라미터 모델을 훈련했다.[2]
PaLM은 상식 추론, 산술 추론, 농담 설명, 코드 생성 및 번역을 포함한 광범위한 작업을 수행할 수 있다.[2][3][4][5] 생각 사슬 프롬프트와 결합했을 때 PaLM은 단어 문제 및 논리 기반 질문과 같은 여러 단계의 추론이 필요한 데이터 세트에서 훨씬 더 나은 성능을 달성했다.[1][2]
이 모델은 2022년 4월에 처음 발표되었으며 구글이 PaLM 및 기타 여러 기술용 API를 출시한 2023년 3월까지 비공개로 유지되었다.[6] API는 대중에게 공개되기 전에 대기자 명단에 등록한 제한된 수의 개발자가 먼저 사용할 수 있다.[7]
구글과 딥마인드는 의료 데이터에 대해 미세 조정되고 의료 질문 응답 벤치마크에서 이전 모델을 능가하는 Med-PaLM이라는 PaLM 540B 버전을 개발했다.[8][9] Med-PaLM은 미국 의료 면허 문제에서 처음으로 합격 점수를 얻었으며 객관식 및 개방형 질문에 모두 정확하게 답하는 것 외에도 추론을 제공하고 자체 응답을 평가할 수 있다.[10]
구글은 또한 비전 변환기를 사용하여 PaLM을 확장하여 로봇 조작에 사용할 수 있는 최첨단 비전 언어 모델인 PaLM-E를 만들었다.[11][12] 이 모델은 재교육이나 미세 조정 없이 경쟁적으로 로봇 작업을 수행할 수 있다.[13]
2023년 5월 구글은 연례 구글 I/O 기조연설에서 PaLM 2를 발표했다.[14] PaLM 2는 3조 6천억 개의 토큰으로 학습된 3,400억 개의 파라미터 모델로 보고되었다.[15]
같이 보기
편집각주
편집- ↑ 가 나 Narang, Sharan; Chowdhery, Aakanksha. “Pathways Language Model (PaLM): Scaling to 540 Billion Parameters for Breakthrough Performance”. 《ai.googleblog.com》 (영어). 2023년 3월 17일에 확인함.
- ↑ 가 나 다 Chowdhery, Aakanksha; Narang, Sharan; Devlin, Jacob; 외. (2022). “PaLM: Scaling Language Modeling with Pathways”. arXiv:2204.02311 [cs.CL].
- ↑ Anadiotis, George (2022년 4월 12일). “Google sets the bar for AI language models with PaLM”. 《VentureBeat》. 2023년 3월 17일에 확인함.
- ↑ Bastian, Matthias (2022년 4월 5일). “Google PaLM: Giant language AI can explain jokes”. 《the decoder》. 2023년 3월 17일에 확인함.
- ↑ “Google: Why Is No One Talking About PaLM”. 《seekingalpha.com》 (영어). 2022년 12월 12일. 2023년 3월 17일에 확인함.
- ↑ Vincent, James (2023년 3월 14일). “Google opens up its AI language model PaLM to challenge OpenAI and GPT-3”. 《The Verge》. 2023년 3월 17일에 확인함.
- ↑ Huffman, Scott; Woodward, Josh. “PaLM API & MakerSuite: an approachable way to start prototyping and building generative AI applications” (영어). 2023년 3월 17일에 확인함.
- ↑ Singhal, Karan; Azizi, Shekoofeh; Tu, Tao; 외. (2022). “Large Language Models Encode Clinical Knowledge”. arXiv:2212.13138 [cs.CL].
- ↑ “MedPaLM: New Chatbots Will Soon Be Better Than Waiting For A Doctor”. 《The Medical Futurist》. 2023년 1월 17일. 2023년 3월 17일에 확인함.
- ↑ Matias, Yossi; Corrado, Greg (2023년 3월 14일). “Our latest health AI research updates”. 《Google》 (미국 영어). 2023년 3월 17일에 확인함.
- ↑ Driess, Danny; Xia, Fei; Sajjadi, Mehdi S. M.; 외. (2023). “PaLM-E: An Embodied Multimodal Language Model”. arXiv:2303.03378 [cs.LG].
- ↑ Driess, Danny; Florence, Pete. “PaLM-E: An embodied multimodal language model”. 《ai.googleblog.com》 (영어). 2023년 3월 17일에 확인함.
- ↑ Edwards, Benj (2023년 3월 7일). “Google's PaLM-E is a generalist robot brain that takes commands”. 《Ars Technica》 (미국 영어). 2023년 3월 17일에 확인함.
- ↑ Lardinois, Frederic (2023년 5월 10일). “Google launches PaLM 2, its next-gen large language model”. 《TechCrunch》. 2023년 5월 10일에 원본 문서에서 보존된 문서. 2023년 5월 10일에 확인함.
- ↑ Elias, Jennifer (2023년 5월 16일). “Google's newest A.I. model uses nearly five times more text data for training than its predecessor”. 《CNBC》. 2023년 5월 18일에 확인함.