准备工作

conda虚拟环境

新建conda虚拟环境

指令如下:

conda create -n llama_factory python=3.10

新建完后,激活这个虚拟环境

conda activate llama_factory 

安装gpu版本的torch

可以上我主页搜,也可以点击:
链接: link

验证一下

import torch
torch.cuda.current_device()
torch.cuda.get_device_name(0)
torch.__version__

如果和图片相似就是对的
在这里插入图片描述

下载源码并配置环境

下载LLaMA-Factory源码
链接为:https://github.com/hiyouga/LLaMA-Factory
下载后解压,进入解压后的代码的主目录后执行指令:

pip install -e ".[torch,metrics]" -i https://pypi.tuna.tsinghua.edu.cn/simple

我的代码在这里,所以需要进入这个路径。
在这里插入图片描述在这里插入图片描述

启动指令

llama_factory环境下输入下列指令

llamafactory-cli webui

如果一切正常,会出现下列所示的效果,并且直接跳转到浏览器
在这里插入图片描述
在这里插入图片描述

安装基准模型

在这里插入图片描述
因为需要下载基准模型,推荐两个社区:huggingface和魔塔社区下载模型。我这边使用的是代码链接魔塔社区下载的,代码如下(需要安装modelscope库):

from modelscope import snapshot_download
model_dir = "E:/Desktop/lla"
model_dir = snapshot_download('qwen/Qwen2-1.5B-Instruct',local_dir=model_dir)

所以解压后(我这里解压后修改过文件名,注意)
在这里插入图片描述
在这里插入图片描述

创建数据集

需要保存在llama_factory源码的data文件夹下
在这里插入图片描述
自己的json数据集复制到这里,并在data_set.json里面注册,注册如下:
在这里插入图片描述
最终如图所示:
在这里插入图片描述
输出目录也需要一个自己的文件夹
在这里插入图片描述
点击开始训练即可。

Logo

ModelScope旨在打造下一代开源的模型即服务共享平台,为泛AI开发者提供灵活、易用、低成本的一站式模型服务产品,让模型应用更简单!

更多推荐