Windows下中文微调Llama3,单卡8G显存只需5分钟,模型可接入GPT4All、Ollama,实现CPU推理聊天,附Colab一键训练脚本。
Windows下中文微调Llama3,单卡8G显存只需5分钟,模型可接入GPT4、Ollama,实现CPU推理聊天,附Colab一键训练脚本。 Llama3模型申请与本地部署 • Llama 3 模型申请与本地部署的几种方法,总有一种适用你。 AI大模型搭建本地知识库 • Video Llama2微调教程 • 🦙使用自己的数据微调Llama 2 最简单方法 ,Llama 2 “烹饪”食谱,附c... Llama2申请与本地部署 • Llama2模型申请与本地部署详细教程 colab一键训练 https://colab.research.google.com/dri... unslo本地安装包下载 百度网盘:https://pan.baidu.com/s/17XehOXC2LMbn... 谷歌网盘:https://drive.google.com/drive/folder... 视频里训练的lora:https://drive.google.com/file/d/1REtJ... Windows本地部署条件 1、Windows10/Windows11 2、英伟达卡8G显存、16G内存,安装CUDA12.1、cuDNN8.9,C盘剩余空间20GB、unsloth安装盘S40GB 3、依赖软件:CUDA12.1+cuDNN8.9、Python11.9、Git、Visual Studio 2022、llvm(可选) 4、HuggingFace账号,上传训练数据集 Windows部署步骤 一、下载安装包 1、安装cuda12.1,配置cuDNN8.9 2、安装Visual Studio 2022 3、解压unsloth 4、安装python11 5、安装git 6、设置llvm系统环境变量(可选) 二、安装unsloth 1、使用python11创建虚拟环境 python311\python.exe -m venv venv 2、激活虚拟环境 call venv\script\activate.bat 3、安装依赖包 pip install torch==2.2.2 --index-url https://download.pytorch.org/whl/cu121 pip install "unsloth[colab-new] @ git+https://github.com/unslothai/unsloth.... pip install --no-deps trl peft accelerate bitsandbytes pip install deepspeed-0.13.1+unknown-py3-none-any.whl pip install triton-2.1.0-cp311-cp311-win_amd64.whl pip install xformers==0.0.25.post1 4、测试安装是否成功 nvcc --version python -m [xformers.info](http://xformers.info/) python -m bitsandbytes 5、运行脚本 test-unlora.py 测试微调之前推理 fine-tuning.py 用数据集微调 test-lora.py 测试微调之后推理 save-16bit.py 合并保存模型16位 save-gguf-4bit.py 4位量化gguf格式 三、4位量化需要安装llama.cpp,步骤如下: 1、git clone https://github.com/ggerganov/llama.cpp 2、按官方文档编译 mkdir build cd build cmake .. -DLLAMA_CUBLAS=ON 3、设置Visual Studio 2022中cmake路径到系统环境变量path里 C:\Program Files\Microsoft Visual Studio\2022\Professional\Common7\IDE\CommonExtensions\Microsoft\CMake\CMake\bin C:\Program Files\Microsoft Visual Studio\2022\Professional 4、编译llama.cpp cmake --build . --config Release 5、如果上面这句编译命令无法执行,需要做以下操作: 复制这个路径下的 C:\Program Files\NVIDIA GPU Computing Toolkit\CUDA\v12.1\extras\visual_studio_integration\MSBuildExtensions 4个文件,粘贴到以下目录里 C:\Program Files (x86)\Microsoft Visual Studio\2022\BuildTools\MSBuild\Microsoft\VC\v170\BuildCustomizations 6、编译好以后,把llama.cpp\build\bing\release目录下的所有文件复制到llama.cpp目录下 7、重新运行fine-tuning.py微调保存为 00:00 介绍 00:44 第一部分colab微调 02:18 训练数据集 03:26 微调设置与训练 06:21 微调后用GPT4All推理 07:21 第二部分本地微调 08:46 本地部署训练程序 13:28 本地微调 14:42 本地量化4位模型

China's Chip Breakthrough Terrifies America and Taiwan

Running a 35B AI Model on 6GB VRAM, FAST (llama.cpp Guide)

都說年紀大學不會語言,這個80歲老人偏不信|Steve Kaufmann:80歲會20種語言,5個方法和你想的完全相反

Windows 10: Four Months to Go (Again)

Optimize Your AI - Quantization Explained

Rufus JUST DESTROYED Windows 11 As Millions Watch Microsoft COLLAPSE!

Automate with Python – Full Course for Beginners

Something is jamming GPS over Europe. Here's what we found

Every Free App You Actually Need Explained in 20 Minutes

離線不怕隱私外洩!免費開源 AI 助手 Ollama 從安裝到微調,一支影片通通搞定!

本地AI哪家强?统一内存大横评!

Claude 最强模型被禁!“开源越狱”才是真自由,实测3款热门无审查模型,是时候部署本地AI了 | 零度解说

史诗级崩盘预警!为什么SpaceX急着上市?你的养老金正沦为硅谷大佬的“提款机”!华尔街的终极阳谋,对散户的收割你根本逃不掉! 【艾财说210】

微軟這波「流氓操作」徹底惹毛全世界,連自家CEO都看不下去了?🔥

一键部署本地私人专属知识库,开源免费!可接入GPT-4、Llama 3、Gemma、Kimi等几十种大模型,零代码集成,1Panel出品。

I Built a Minimalist AI Note Device

15分鐘學會AI Agent|完整講解

The Local AI Hardware Mistake Everyone Makes

戲耍整個日本神秘罪犯,130萬次警力追兇40餘年,依舊沒能抓住他

