Amazon Bedrock에 기반한 Meta의 Llama

Llama와 함께 AI의 미래 구축

Llama 3.3 소개

Llama 3.3은 텍스트 전용 70B 명령어 튜닝 모델로, Llama 3.1 70B에 비해 향상된 성능을 제공합니다. 텍스트 전용 애플리케이션에 사용할 때는 Llama 3.2 90B에 비해 성능이 향상되었습니다. Llama 3.3 70B는 Llama 3.1 405B와 비슷한 성능을 제공하지만 컴퓨팅 리소스의 일부만 필요합니다.

Lama 3.3 70B의 포괄적인 훈련을 통해 다양한 태스크에서 강력한 이해 및 생성 능력을 얻을 수 있습니다. 이 모델은 콘텐츠 제작, 엔터프라이즈 애플리케이션 및 연구를 위해 설계된 고성능 대화형 AI를 지원하며 텍스트 요약, 분류, 감정 분석, 코드 생성을 포함한 고급 언어 이해 기능을 제공합니다.

Llama 3.2 90B는 Meta의 가장 최신 모델이며 엔터프라이즈급 애플리케이션에 적합합니다. Llama 3.2는 비전 작업을 지원하는 최초의 Lama 모델로, 이미지 인코더 표현을 언어 모델에 통합하는 새로운 모델 아키텍처를 갖추고 있습니다. 이 모델은 일반적인 지식, 긴 텍스트 생성, 다국어 번역, 코딩, 수학, 고급 추론에 탁월합니다. 또한 이미지 추론 기능을 도입하여 정교한 이미지 이해와 비주얼 추론이 가능합니다. 이 모델은 이미지 캡션 지정, 이미지-텍스트 검색, 비주얼 그라운딩, 비주얼 질의 응답 및 비주얼 추론, 문서 비주얼 응답 등의 사용 사례에 적합합니다.

Llama 3.2 11B는 콘텐츠 제작, 대화형 AI, 언어 이해에 매우 적합하며 비주얼 추론이 필요한 엔터프라이즈 애플리케이션에도 매우 적합합니다. 이 모델은 이미지에 대한 추론 기능이 추가되었으므로 텍스트 요약, 감정 분석, 코드 생성, 지침 준수 부문에서 강력한 성능을 보여줍니다. 이 모델은 이미지 캡션 지정, 이미지-텍스트 검색, 비주얼 그라운딩, 비주얼 질의 응답 및 비주얼 추론, 문서 비주얼 응답 등의 사용 사례에 적합합니다.

Lama 3.2 3B는 온디바이스 처리를 통해 더욱 맞춤화된 AI 경험을 제공합니다. Llama 3.2 3B는 추론의 지연 시간이 짧아야 하고 계산 리소스가 한정된 애플리케이션을 위해 설계되었습니다. 이 모델은 텍스트 요약, 분류, 언어 번역 작업에 탁월합니다. 이 모델은 모바일 AI 기반의 쓰기 도우미 및 고객 서비스 애플리케이션 같은 사용 사례에 적합합니다.

Lama 3.2 1B는 Lama 3.2 모델 컬렉션 중 가장 가벼운 모델이며 엣지 디바이스 및 모바일 애플리케이션의 검색 및 요약에 매우 적합합니다. 이를 통해 온디바이스 AI 기능을 지원하는 동시에 사용자의 개인정보를 보호하고 지연 시간을 최소화합니다. 이 모델은 개인 정보 관리 및 다국어 지식 검색 같은 사용 사례에 적합합니다.

이점

Lama 3.2는 온디바이스 처리를 통해 더욱 맞춤화된 AI 경험을 제공합니다. Llama 3.2 모델은 지연 시간을 줄이고 성능을 높여 더욱 효율적으로 설계되었으므로, 광범위한 애플리케이션에 적합합니다.
Llama는 12만 8,000개에 달하는 컨텍스트 길이를 활용하여 데이터 내의 훨씬 더 미묘한 관계를 포착할 수 있습니다.
Llama 모델은 온라인 퍼블릭 데이터 소스의 토큰 15조 건을 기반으로 훈련되어 언어의 복잡성을 더 잘 이해할 수 있습니다.
Llama 3.2는 다국어 기반 서비스로, 영어, 독일어, 프랑스어, 이탈리아어, 포르투갈어, 힌디어, 스페인어, 태국어를 포함한 8개 언어를 지원합니다.
Amazon Bedrock의 관리형 API를 사용하면 Llama 모델을 그 어느 때보다 쉽게 사용할 수 있습니다. 모든 규모의 조직이 기본 인프라를 걱정하지 않고도 Llama의 기능을 이용할 수 있습니다. Amazon Bedrock은 서버리스이므로 인프라를 관리할 필요가 없으며 이미 익숙한 AWS 서비스를 사용하여 Llama의 생성형 AI 기능을 애플리케이션에 안전하게 통합하고 배포할 수 있습니다. 자신이 가장 잘하는 일, 즉 AI 애플리케이션 구축에 집중할 수 있습니다.

Llama 소개

지난 10년 동안 Meta는 개발자에게 도구를 제공하고 개발자, 연구자 및 조직 간 협업과 발전을 촉진하는 데 중점을 두었습니다. Llama 모델은 다양한 파라미터 크기로 제공되므로, 개발자는 요구 사항 및 추론 예산에 가장 적합한 모델을 선택할 수 있습니다. Amazon Bedrock의 Llama 모델을 사용하면 개발자가 확장성이나 인프라 관리를 걱정할 필요가 없기 때문에 새로운 기회를 모색할 수 있습니다. Amazon Bedrock은 개발자가 Llama 사용을 시작해볼 수 있는 매우 간단한 턴키 방식을 지원합니다.

사용 사례

Llama 모델은 이미지 이해 및 비주얼 추론, 언어의 뉘앙스, 문맥 이해 및 복잡한 작업(예: 비주얼 데이터 분석, 이미지 캡션 지정, 대화 생성, 번역 및 대화 생성)에 탁월하며 여러 단계의 작업도 손쉽게 처리할 수 있습니다. 정교한 비주얼 추론 및 이해, 이미지-텍스트 검색, 비주얼 그라운딩, 문서 비주얼 질문에 대한 답변, 텍스트 요약 및 정확도, 텍스트 분류, 감정 분석 및 뉘앙스 추론, 언어 모델링, 대화 시스템, 코드 생성 및 지침 준수 등과 같은 추가적인 사용 사례에도 Llama 모델이 매우 적합합니다.

모델 버전

Llama 3.3 70B

텍스트 전용 70B 명령어 튜닝 모델로 텍스트 전용 애플리케이션에 사용할 때, Llama 3.1 70B 및 Llama 3.2 90B에 비해 성능이 향상되었습니다. Llama 3.3 70B는 Llama 3.1 405B와 비슷한 성능을 제공하지만 컴퓨팅 리소스의 일부만 필요합니다.

최대 토큰 수: 12만 8,000개

언어: 영어, 독일어, 프랑스어, 이탈리아어, 포르투갈어, 스페인어, 태국어.

미세 조정 지원: 아니요

지원되는 사용 사례: 콘텐츠 제작, 엔터프라이즈 애플리케이션 및 연구를 위해 설계된 대화형 AI로 텍스트 요약, 분류, 감정 분석, 코드 생성을 비롯한 고급 언어 이해 기능을 제공합니다. 또한 이 모델은 모델 출력을 활용하여 합성 데이터 생성 및 증류를 포함해 다른 모델을 개선하는 기능을 지원합니다.

Llama 3.2 90B

텍스트와 이미지의 입력과 출력을 모두 가져오는 멀티모달 모델. 이미지 분석, 문서 처리, 멀티모달 챗봇, 자율 시스템과 같이 정교한 시각 인텔리전스가 필요한 애플리케이션에 적합합니다.

최대 토큰 수: 12만 8,000개

언어: 영어, 독일어, 프랑스어, 이탈리아어, 포르투갈어, 힌디어, 스페인어, 태국어.

미세 조정 지원: 아니요

지원되는 사용 사례: 시각적 입력 및 텍스트 입력에서 추론하고 결론을 도출하는 고유한 기능을 통해 이미지 캡션, 이미지-텍스트 검색, 시각적 그라운딩, 시각적 질의 응답, 시각적 문서 질의 응답과 같은 고급 애플리케이션을 지원하는 이미지 이해, 시각적 추론, 다중 모드 상호 작용

블로그 읽기

Llama 3.2 11B

텍스트와 이미지의 입력과 출력을 모두 가져오는 멀티모달 모델. 이미지 분석, 문서 처리, 멀티모달 챗봇과 같이 정교한 시각적 인텔리전스가 필요한 애플리케이션에 적합합니다.

최대 토큰 수: 12만 8,000개

언어: 영어, 독일어, 프랑스어, 이탈리아어, 포르투갈어, 힌디어, 스페인어, 태국어.

미세 조정 지원: 아니요

지원되는 사용 사례: 이미지 캡션, 이미지-텍스트 검색, 시각적 그라운딩, 시각적 질의 응답, 시각적 문서 질의 응답과 같은 고급 애플리케이션을 위한 이미지 이해, 시각적 추론, 멀티모달 상호 작용 등의 사용 사례를 지원합니다.

블로그 읽기

Llama 3.2 3B

매우 정확하고 관련성 높은 결과를 제공하도록 구축된 텍스트 전용 경량 모델입니다. 추론의 지연 시간이 짧아야 하고 계산 리소스가 한정된 애플리케이션을 위해 설계되었습니다. 쿼리 및 프롬프트 재작성, 모바일 AI 기반 쓰기 도우미, 고객 서비스 애플리케이션, 특히 효율성과 짧은 지연 시간으로 모바일 AI 기반 쓰기 도우미 및 고객 서비스 챗봇을 비롯한 다양한 애플리케이션에 원활하게 통합되는 엣지 디바이스에 적합합니다.

최대 토큰 수: 12만 8,000개

언어: 영어, 독일어, 프랑스어, 이탈리아어, 포르투갈어, 힌디어, 스페인어, 태국어.

미세 조정 지원: 아니요

지원되는 사용 사례: 고급 텍스트 생성, 요약, 감정 분석, 감성 인텔리전스, 컨텍스트 이해, 상식적인 추론

블로그 읽기

Llama 3.2 1B

빠르고 정확한 응답을 제공하도록 구축된 텍스트 전용 경량 모델입니다. 엣지 디바이스 및 모바일 애플리케이션에 적합합니다. 이 모델을 통해 온디바이스 AI 기능을 지원하는 동시에 사용자의 개인정보를 보호하고 지연 시간을 최소화합니다.

최대 토큰 수: 12만 8,000개

언어: 영어, 독일어, 프랑스어, 이탈리아어, 포르투갈어, 힌디어, 스페인어, 태국어.

미세 조정 지원: 아니요

지원되는 사용 사례: 개인 정보 관리, 다국어 지식 검색, 재작성 작업과 같은 다국어 대화 사용 사례

블로그 읽기

Llama 3.1 405B

엔터프라이즈급 애플리케이션, 연구 개발, 가상 데이터 생성, 모델 증류에 적합합니다. 공개 평가판으로 사용할 수 있는 지연 시간 최적화 추론 기능을 갖춘 이 모델이 제공하는 뛰어난 성능과 확장성을 통해 조직은 다양한 사용 사례에서 고품질 출력을 유지하면서 AI 이니셔티브를 가속화할 수 있습니다.

최대 토큰 수:
12만 8,000개

언어: 영어, 독일어, 프랑스어, 이탈리아어, 포르투갈어, 힌디어, 스페인어, 태국어.

지원되는 미세 조정: 곧 출시 예정

지원되는 사용 사례: 일반 지식, 긴 형식의 텍스트 생성, 기계 번역, 뛰어난 문맥 이해, 고급 추론 및 의사 결정, 모호성 및 불확실성 개선, 창의성과 다양성 향상, 조정 가능성, 수학, 도구 사용, 다국어 번역 및 코딩.

블로그 읽기

Llama 3.1 70B

콘텐츠 제작, 대화형 AI, 언어 이해, 연구 개발, 기업 애플리케이션에 적합합니다. 공개 평가판으로 사용할 수 있는 새로운 지연 시간 최적화 추론 기능을 갖춘 이 모델은 방대한 텍스트 입력 처리를 통해 애플리케이션이 더 빠르게 응답하고 더 긴 쿼리를 더 효율적으로 처리할 수 있도록 하는 AI 솔루션의 새로운 성능 기준을 정의합니다.

최대 토큰 수: 12만 8,000개

언어: 영어, 독일어, 프랑스어, 이탈리아어, 포르투갈어, 힌디어, 스페인어, 태국어.

미세 조정 지원: 예

지원되는 사용 사례: 텍스트 요약, 텍스트 분류, 감정 분석, 언어 번역

블로그 읽기

Llama 3.1 8B

컴퓨팅 성능과 리소스가 제한된 상황, 훈련 시간을 단축하려는 경우, 엣지 디바이스에서 사용하려는 경우에 적합합니다.

최대 토큰 수: 12만 8,000개

언어: 영어, 독일어, 프랑스어, 이탈리아어, 포르투갈어, 힌디어, 스페인어, 태국어.

미세 조정 지원: 예

지원되는 사용 사례: 텍스트 요약, 텍스트 분류, 감정 분석, 언어 번역

블로그 읽기

Llama 3 70B

콘텐츠 제작, 대화형 AI, 언어 이해, 연구 개발 및 엔터프라이즈 애플리케이션에 적합합니다. 

최대 토큰 수: 8,000

언어: 영어

미세 조정 지원: 미제공

지원되는 사용 사례: 텍스트 요약 및 정확도, 텍스트 분류 및 뉘앙스, 감정 분석 및 뉘앙스 추론, 언어 모델링, 대화 시스템, 코드 생성, 지침 준수.

블로그 읽기

Llama 3 8B

컴퓨팅 파워와 리소스가 제한된 상황, 훈련 시간을 단축하려는 경우, 엣지 디바이스에서 사용하려는 경우에 적합합니다.

최대 토큰 수: 8,000

언어: 영어

미세 조정 지원: 미제공

지원되는 사용 사례: 텍스트 요약, 텍스트 분류, 감정 분석, 언어 번역

블로그 읽기

Llama 2 70B

70억 개 파라미터 규모의 미세 조정 모델입니다. 언어 모델링, 텍스트 생성, 대화 시스템 등의 대규모 작업에 적합합니다.

최대 토큰 수: 4,000개

언어: 영어

미세 조정 지원: 가능

지원되는 사용 사례: 어시스턴트와 유사한 채팅

블로그 읽기

Llama 2 13B

130억 개 파라미터 규모의 미세 조정 모델입니다. 텍스트 분류, 감정 분석, 언어 번역과 같은 소규모 작업에 적합합니다.

최대 토큰 수: 4,000개

언어: 영어

미세 조정 지원: 가능

지원되는 사용 사례: 어시스턴트와 유사한 채팅

블로그 읽기

Nomura, Amazon Bedrock에서 Meta의 Llama 모델을 사용하여 생성형 AI의 대중화

 

Nomura의 Executive Director 겸 Enterprise Architect인 Aniruddh Singh는 Amazon Bedrock 및 Meta의 Lama 모델을 사용하여 기업 전반에서 생성형 AI를 대중화하기 위한 금융 기관의 여정을 간략하게 설명합니다. Amazon Bedrock은 Llama와 같은 주요 파운데이션 모델에 대한 중요한 액세스를 제공하여 원활한 통합을 지원합니다. Llama는 텍스트 요약, 코드 생성, 로그 분석 및 문서 처리 전반에 걸쳐 더 빠른 혁신, 투명성, 바이어스 가드레일, 강력한 성능 등의 주요 이점을 Nomura에 제공합니다. 

TaskUs, Amazon Bedrock에서 Meta의 Llama 모델을 사용하여 고객 경험 혁신

세계에서 가장 혁신적인 기업에 디지털 서비스를 아웃소싱하고 차세대 고객 경험을 제공하는 선도적인 회사인 TaskUs는 고객이 브랜드를 대표하고 보호하며 성장시킬 수 있도록 지원합니다. Amazon Bedrock 및 Meta의 Lama 모델에 기반한 혁신적인 TaskGPT 플랫폼을 사용하면 팀원의 역량을 강화하여 탁월한 서비스를 제공할 수 있습니다. TaskUs는 Amazon Bedrock 및 Llama를 활용하여 비용 효율적인 바꿔쓰기, 콘텐츠 생성, 이해 및 복잡한 작업 처리를 지원하는 도구를 TaskGPT에 구축합니다.