Course_Project_NLP

History

Name		Name	Last commit message	Last commit date
parent directory ..
__pycache__		__pycache__
chat_logs		chat_logs
chatbot		chatbot
data		data
distill		distill
Readme.md		Readme.md
app.py		app.py
csv2json.py		csv2json.py
evaluate.py		evaluate.py
finetune.py		finetune.py
give_star.py		give_star.py
gpt.py		gpt.py
senta2score.py		senta2score.py
staring_linear.py		staring_linear.py
staring_simple.py		staring_simple.py
utils.py		utils.py
基于情感分析技术的餐馆评分系统.pdf		基于情感分析技术的餐馆评分系统.pdf

Readme.md

Readme

0-环境配置

项目运行环境

nvcc: NVIDIA (R) Cuda compiler driverCopyright (c) 2005-2021 NVIDIA CorporationBuilt on Sun Mar 21 19:15:46 PDT 2021Cuda compilation tools, release 11.3，V11.3.58Build cuda 11.3.r11.3/compiler.29745058 0

paddle version: 2.4.2
paddlenlp version: 2.5.2.post
torch version: 1.10.1

由于UIE项目是基于PaddleNLP框架进行构建的，因此我们需要配置paddlepaddle及paddlenlp的框架。

查看/usr/local/目录，包含11.x三个cuda版本，首先在paddle官网安装对应版本的paddlepaddle框架

python -m pip install paddlepaddle-gpu==0.0.0.post112 -f https://www.paddlepaddle.org.cn/whl/linux/gpu/develop.html

安装paddlenlp框架

pip install --upgrade paddlenlp>=2.0.0rc -i https://pypi.org/simple

或采用python程序的安装方法，首先拉取paddleNLP的项目库

git@github.com:PaddlePaddle/PaddleNLP.git
cd PaddleNLP

之后执行python setup.py进行paddleNLP依赖的安装。

首先从Hugging Face Hub 上下载chatglm-6b所需的config等文件

GIT_LFS_SKIP_SMUDGE=1 git clone https://huggingface.co/THUDM/chatglm-6b

从https://cloud.tsinghua.edu.cn/d/fb9f16d6dc8f482596c2/下载模型参数文件
文件组织形式如下

调用如下代码检查ChatGLM-6B 模型是否能够成功生成推理。

import os
import gradio as gr
os.environ["CUDA_VISIBLE_DEVICES"] = "1"
from transformers import AutoTokenizer, AutoModel

class Chatbot():
    def __init__(self,path):
        self.path=path
        self.tokenizer = AutoTokenizer.from_pretrained(path, trust_remote_code=True)
        self.model = AutoModel.from_pretrained(path, trust_remote_code=True).half().cuda()
        self.model = self.model.eval()
 Chatbot()

1-文件说明

chat_logs #chatbot的一些历史记录和rawdata,可供chatbot进行训练
chatbot   #关于chatbot微调、评估的相关代码
distill   #蒸馏的相关代码文件
results   #UIE预训练模型
app.py    #利用gradio的前端代码，整合了实现的所有功能
utils.py #微调中一些方法和toolbox
csv2json.py #统一训练格式
evaluate.py #测试集评估代码
finetune.py #uie微调代码
give_star.py #用于gradio前端的评分类
gpt.py  #用于gradio前端的gpt初始化类
senta2score.py  #评论生成分数
staring_linear.py#利用机器学习方法进行评分
staring_simple.py#利用简单aspect加权进行评分的实现

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Files

Course_Project_NLP

Course_Project_NLP

Readme.md

Readme

0-环境配置

项目运行环境

1-文件说明

Files

Course_Project_NLP

Directory actions

More options

Directory actions

More options

Latest commit

History

Course_Project_NLP

Folders and files

parent directory

Readme.md

Readme

0-环境配置

项目运行环境

1-文件说明