Meta 의 오픈소스 llama3 모델 Windows 에서 실행하기

개발

Meta 의 오픈소스 llama3 모델 Windows 에서 실행하기

후이넘 2024. 6. 3. 21:27

728x90

개요

최근에 meta의 오픈소스 LLM 모델인 llama3 가 공개되었습니다. 8B, 70B 두 가지 모델이 공개가 되었고, 멀티 모달을 지원하는 400B 모델은 곧 공개가 된다고 합니다.

llama3 모델을 로컬 PC에서 돌리는 방법은 이전에 포스팅했던 llama2 모델 실행하는 방법을 참고하시면 됩니다.

2024.06.03 - [개발] - Meta의 LLM 모델 LLaMA 2를 Windows에서 실행하기

Meta의 LLM 모델 LLaMA 2를 Windows에서 실행하기

1. 개요Meta에서 공개한 LLaMA 2 모델은 파라미터 개수가 7B, 13B, 70B 인 3가지 사이즈로 제공이 됩니다. 여기서 B는 Billion(10억)의 약자입니다. 가장 작은 모델인 7B는 파라미터 개수가 70억개이고, INT8

lastlaugher.tistory.com

대부분은 위와 동일하게 진행하면 되고, 달라진 점은 아래와 같습니다.

모델 다운로드

llama3 모델을 아래 경로에서 다운로드합니다. 저는 Meta-Llama-3-8B-Instruct.Q5_K_M.gguf 을 사용했습니다.
https://huggingface.co/QuantFactory/Meta-Llama-3-8B-Instruct-GGUF/tree/main

QuantFactory/Meta-Llama-3-8B-Instruct-GGUF at main

huggingface.co

GPU 파라미터 추가

llama.cpp 최신 버전에서는 -ngl 99 옵션을 추가로 입력해야 GPU를 사용해서 inference를 수행하게 됩니다.

실행 결과

아직 llama.cpp 에 버그가 있는 것 같습니다. 응답을 잘해주다가 뒤쪽에서 반복된 대답 및 특수 문자가 출력됩니다. end token 처리가 잘 안 된 것처럼 보입니다. llama.cpp 프로젝트가 상당히 자주 업데이트가 되고 있으므로 곧 해결이 될 걸로 예상이 됩니다.

728x90

'개발' 카테고리의 다른 글

Windows에서 Python 으로 LLaMA2 모델 실행하기 (feat. llama-cpp-python) (2)	2024.06.03
Meta의 LLM 모델 LLaMA 2를 Windows에서 실행하기 (4)	2024.06.03

현재글Meta 의 오픈소스 llama3 모델 Windows 에서 실행하기

개발과 투자 이야기

소프트웨어 개발, 자기 개발, 자기 계발, 자기 투자, 재태크 투자에 대한 블로그입니다.

250x250

multi user, 돈의속성, 적정심리학, telegram, 공모주, 더본코리아, 7월, 텔레그램봇, 충조편판, 김승호, 당신이옳다, 다중사용자, Bot, monetag, 최대어, 청약, 앱테크, 텔레그램, 광고플랫폼, 정혜신,

Today :
Yesterday :

일	월	화	수	목	금	토
		1	2	3	4	5
6	7	8	9	10	11	12
13	14	15	16	17	18	19
20	21	22	23	24	25	26
27	28	29	30	31

개발과 투자 이야기