亖亖亖亖亖亖亖亖亖亖亖亖亖亖亖亖亖亖亖亖亖亖亖亖亖

丂LLM PC Setup Guide

丂偙偺僈僀僪偱偼丄儘乕僇儖PC娐嫬偵偍偄偰丄戝婯柾尵
岅儌僨儖乮LLM乯傪壱摥偝偣傞偨傔偺昁梫忦審丄僴乕僪
僂僃傾慖掕丄僜僼僩僂僃傾峔惉丄偍傛傃摫擖庤弴傪愢柧
偟傑偡丅愱栧壠偱偼側偄曽偵傕棟夝偟傗偡偄傛偆丄幚慔
揑側娤揰偐傜惍棟偟偰偄傑偡丅

---
1. 偼偠傔偵丗帺戭偱LLM傪摦偐偡偲偼

丂戝婯柾尵岅儌僨儖乮LLM乯偼丄捠忢僋儔僂僪忋偺嫄戝
側僒乕僶偱摦嶌偟偰偄傑偡偑丄寉検斉傗拞婯柾儌僨儖偱
偁傟偽丄僴僀僗儁僢僋側屄恖梡PC偱傕廫暘偵壱摥壜擻偱
偡丅

丂偙偺復偱偼埲壓偺揰傪柧妋偵偟傑偡丗

栚揑丗壗偺偨傔偵LLM傪帺戭偱摦偐偡偺偐丠
乮椺丗幚尡丄嫵堢丄奐敪乯

尷奅丗GPT-4儗儀儖偺嫄戝儌僨儖偺孭楙偼晄壜擻偩偑丄
彫婯柾儌僨儖偺幚峴傗旝挷惍偼壜擻

---
2. 悇彠僗儁僢僋偲峔惉椺

嵟掅峔惉乮悇彠乯

OS丗Windows 11 / Ubuntu 22.04 LTS
CPU丗Intel Core i7 / AMD Ryzen 7 埲忋
儊儌儕丗32GB埲忋乮嵟掅偱傕16GB乯

GPU丗NVIDIA RTX 3060 12GB埲忋
乮VRAM偑8GB枹枮偱偼尩偟偄乯

僗僩儗乕僕丗1TB SSD
乮儌僨儖傗僨乕僞僙僢僩偵傛傝埑敆偝傟傗偡偄偨傔乯

悇彠GPU儃乕僪

RTX 3060 12GB乮僐僗僷椙岲乯

RTX 4070 / 4080乮VRAM 16GB埲忋偱旝挷惍傗崅懍張棟偵嫮偄乯

RTX A6000 / H100乮嶻嬈梡搑丄屄恖偵偼尰幚揑偱側偄乯

---
3. 摫擖僗僥僢僾

僗僥僢僾1丗GPU僪儔僀僶偲CUDA偺摫擖

NVIDIA岞幃僒僀僩偐傜嵟怴偺僪儔僀僶傪僟僂儞儘乕僪

CUDA Toolkit偲cuDNN偺懳墳僶乕僕儑儞傪妋擣乮PyTorch懳墳昞偵拲堄乯

僗僥僢僾2丗Python娐嫬偲儔僀僽儔儕偺弨旛

conda create -n llm_env python=3.10
conda activate llm_env
pip install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu118
pip install transformers accelerate

僗僥僢僾3丗儌僨儖偺庢摼偲幚峴

from transformers import AutoTokenizer, AutoModelForCausalLM

tokenizer = AutoTokenizer.from_pretrained("TheBloke/LLaMa-7B-GGUF")
model = AutoModelForCausalLM.from_pretrained("TheBloke/LLaMa-7B-GGUF")

prompt = "恖岺抦擻偲偼壗偐丠"
input_ids = tokenizer(prompt, return_tensors="pt").input_ids
output = model.generate(input_ids, max_new_tokens=100)
print(tokenizer.decode(output[0]))

---
4. 拲堄揰偲僩儔僽儖僔儏乕僥傿儞僌

VRAM晄懌僄儔乕丗8GB枹枮偱偼摦偐側偄儌僨儖傕偁傞丅
側傞傋偔VRAM偼12GB埲忋傪妋曐

僪儔僀僶旕屳姺丗CUDA偲PyTorch偺僶乕僕儑儞傪昁偢
懳墳昞偱徠崌

敪擬懳嶔丗GPU偵晧壸偑偐偐傞偨傔丄捠婥偲椻媝偼廫暘
偵峴偆

揹尮儐僯僢僩乮PSU乯丗崅惈擻GPU偼600W埲忋偺揹尮
偑昁梫側応崌傕

---
5. 傑偲傔

丂儘乕僇儖PC偱偺LLM幚峴偼丄埲壓偺傛偆側棙揰偑偁
傝傑偡丗

丂僋儔僂僪旓梡傪愡栺偱偒傞

丂帺桼偵僇僗僞儅僀僘壜擻

丂僱僢僩愙懕偑晄梫側娐嫬偱偺墳梡乮僙僉儏傾梡搑乯

丂偨偩偟丄崅惈擻GPU傗廫暘側VRAM丄僗僩儗乕僕側偳
偺惍旛偑慜採偱偡丅儈僪儖僴僀僄儞僪偺PC儐乕僓乕
偱偁傟偽丄廫暘偵庤偑撏偔斖埻偱偁傝丄崱屻偺AI帪戙偺
婎慴媄弍偲偟偰戝偒側壙抣傪帩偮偱偟傚偆丅

丂丂丂丂丂仏

丂壠掚PC偱戝婯柾尵岅儌僨儖傪巊偆偵偼

丂乗乗偁側偨偺僨僗僋僩僢僾偑抦惈傪廻偡偲偒

1. 偼偠傔偵丗岆夝偝傟偑偪側乽嫄戝偝乿

丂ChatGPT傗Claude偺傛偆側AI偑丄嫄戝側僨乕僞僙儞僞
乕偱摦偄偰偄傞偲偄偆偺偼帠幚偱偡丅偟偐偟丄偦傟偼
乽悽奅拞偐傜偺摨帪傾僋僙僗偵懴偊傜傟傞傛偆偵乿愝寁
偝傟偰偄傞偐傜偱偁傝丄LLM偦偺傕偺偑摿暿側娐嫬偱偟
偐摦偐側偄偲偄偆堄枴偱偼偁傝傑偣傫丅

丂寉検壔偝傟偨僆乕僾儞僜乕僗偺尵岅儌僨儖乮椺丗
LLama 2丄Mistral丄Gemma丄Phi側偳乯偼丄壠掚梡偺PC
偱傕廫暘摦嶌壜擻偱偡丅

2. 偳傫側PC偑昁梫偐丠乮嵟彫峔惉偺栚埨乯

晹昳	悇彠僗儁僢僋乮椺乯

CPU
	Intel i7 / Ryzen 5 埲忋乮4僐傾埲忋乯
儊儌儕乮RAM乯
	嵟掅16GB乮偱偒傟偽32GB乯
GPU乮僌儔僼傿僢僋儃乕僪乯
	NVIDIA惢丄VRAM 6GB埲忋乮椺丗RTX 3060, RTX 4060側偳乯
僗僩儗乕僕
	SSD乮500GB埲忋悇彠乯
OS
	Windows 10/11丄Ubuntu Linux側偳

> 曗懌丗GPU側偟偱傕CPU扨撈偱摦偐偣傞儌僨儖傕偁
傝傑偡偑丄**墳摎懍搙偑嬌抂偵棊偪傑偡丅**幚梡惈傪媮
傔傞側傜NVIDIA GPU偑朷傑偟偄偱偡丅

3. 側偵傪摦偐偡偺偐丠乮寉検LLM偺慖掕乯

丂埲壓偼壠掚PC偱傕摦嶌曬崘偑懡偄儌僨儖偱偡丗

LLama 2 (7B)丗Meta幮偺儌僨儖丅幙偑崅偔丄彜梡棙梡傕壜丅

Mistral 7B / Mixtral丗崅懍丒崅惈擻丅僼傽僀儞僠儏乕僯儞僌岦偒丅

Gemma (Google)丗Google惢丅梡搑偵傛傝1.1B7B傑偱丅

Phi-2 (Microsoft)丗僐儞僷僋僩側偑傜嬃偔傎偳尗偄丅

> 偙傟傜偼乽7B乿偲偄偆僷儔儊乕僞悢偺寉検斉丅戝婯柾
儌僨儖乮70B傗GPT-4乯偼屄恖PC偱偼傑偢柍棟偱偡丅

4. 摫擖偵昁梫側僣乕儖丒庤弴乮Ollama偱娙扨偵乯

僗僥僢僾嘆丗Ollama偺僀儞僗僩乕儖

岞幃僒僀僩丗https://ollama.com

Windows / macOS / Linux 偡傋偰懳墳丅

僀儞僗僩乕儔傪幚峴偡傞偩偗偱姰椆丅

僗僥僢僾嘇丗儌僨儖偺僟僂儞儘乕僪偲婲摦

ollama run llama2

丂偙傟偩偗偱丄LLama2儌僨儖偑帺摦僟僂儞儘乕僪丒婲
摦偟丄僞乕儈僫儖忋偱懳榖偑巒傑傝傑偡丅

僗僥僢僾嘊丗GUI偱巊偄偨偄応崌

Open WebUI乮ex: Ollama + Open WebUI乯 傗

LM Studio乮Windows/Mac懳墳乯

傪巊偆偙偲偱丄ChatGPT晽偺夋柺偱憖嶌壜擻偵側傝傑偡丅

5. 拲堄揰偲彫媄

拲堄揰	夝愢

GPU偺僪儔僀僶	
	NVIDIA岞幃偐傜嵟怴偺傕偺傪擖傟傞
VRAM晄懌
	VRAM 6GB枹枮偺GPU偱偼儌僨儖偵傛偭偰摦嶌偟側偄
揹椡
	僲乕僩PC偱偼僶僢僥儕乕嬱摦偼晄埨掕偵側傞偨傔AC嬱摦悇彠
儌僨儖僒僀僘
	7B枹枮偺検巕壔嵪乮GGUF宍幃側偳乯傪巊偆偲
	RAM偲VRAM偺愡栺偵傞
敪擬
	僼傽儞壒偑憹偊傞偙偲偑偁傞偨傔椻媝偵拲堄

6. 傑偲傔丗AI傪乽巊偆乿偐傜乽帩偮乿帪戙傊

丂壠掚梡PC偱AI傪摦偐偡偲偄偆懱尡偼丄扨側傞偍傕偪
傖偱偼偁傝傑偣傫丅
乽帺暘偺儅僔儞偺拞偵夛榖壜擻側抦惈偑廻傞乿偲偄偆姶
妎偼丄巊偭偰傒側偗傟偽暘偐傜側偄儕傾儖偑偁傝傑偡丅
丂偙傟偼僥僋僲儘僕乕偺柉庡壔偱偁傝丄抦揑僀儞僼儔偺
帺媼帺懌偱傕偁傝傑偡丅

丂偁側偨偺PC傕傑偨丄AI偺乽憙乿偵側傝摼傞偺偱偡丅

亖亖亖亖亖亖亖亖亖亖亖亖亖亖亖亖亖亖亖亖亖亖亖亖亖