图神经网络之针对短文本分类的异质图注意力网络 - 让代码跑起来

    科技2022-07-10  99

    本文介绍如何运行图神经网络类论文的代码。

    《EMNLP 2019开源论文:针对短文本分类的异质图注意力网络》

    论文介绍:https://mp.weixin.qq.com/s/eCmvUaM4Vg5KCFQJcRO-TQ

    论文地址:https://www.paperweekly.site/papers/3211

    GitHub代码实现地址:https://github.com/ytc272098215/HGAT

     

    一、需要的环境:

    Anaconda3 (Python 3.6或3.7)、Pytorch、gensim

     

    二、环境配置简要指南:

    1. Anaconda下载地址https://www.anaconda.com/download/,根据自己的平台选择下载安装包,并完成安装。Anaconda是很常用的平台,安装过程不再赘述。

    2. Pytorch安装官网https://pytorch.org/get-started/locally/,在Anaconda Prompt执行以下命令:

    conda install pytorch torchvision cudatoolkit=10.2 -c pytorch

    由于Pytorch较大,如果Pytorch安装缓慢,可以添加清华大学镜像站至Anaconda,在终端中输入以下命令:

    conda config --add channels http://mirror.tuna.tsinghua.edu.cn/anaconda/pkgs/main/ conda config --add channels http://mirror.tuna.tsinghua.edu.cn/anaconda/pkgs/free/ conda config --set show_channel_urls yes

    以及:

    conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud/conda-forge/ conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud/msys2/ conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud/bioconda/ conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud/menpo/ conda config --add channels https://mirrors.tuna.tsinghua.edu.cn/anaconda/cloud/pytorch/

    然后要注意将官网提供的命令行中的-c pytorch去除,即运行

    conda install pytorch torchvision cudatoolkit=10.2

    等待一段时间即可安装成功。

    3. gensim安装官网https://pypi.org/project/gensim/,在Anaconda Prompt执行以下命令:

    pip install --upgrade gensim

    4. 检查环境

    利用 import xxx 或者 pip list 检查是否正确安装。

     

     

    可能出现的错误:

    a.无法定位程序输入点于……动态链接库

    找到anaconda安装路径,进入 \DLLS 文件夹,查看 libcrypto-1_1-x64.dll 文件的修改日期,进入 \Library\bin 文件夹,查看 libcrypto-1_1-x64.dll 文件修改日期,如果两文件修改日期不同,用 DLLS文件夹下的 libcrypto-1_1-x64.dll 替换 bin文件夹下的libcrypto-1_1-x64.dll,重新尝试安装

    b.The environment is inconsistent, please check the package plan carefully.

    解决方法:

    conda install anaconda

     

    三、运行代码

    在Anaconda Prompt执行命令

    cd ./model/code/ python train.py

    cd ./model/code/  是说要定位到代码所在文件夹。例如:

    程序将开始运行。初始数据集是example

     

    四、更换数据集

    https://github.com/ytc272098215/HGAT提供了更多的数据集,可以通过Google Drive下载。解压后如下:

    以运行agnews数据集为例,需要将agnews文件夹放到 .\model\data 文件夹,更改 .\model\code 中 train.py 的一句代码。

    dataset = 'example'

    改为

    dataset = 'agnews'

    保存后运行即可。

    可能出现的错误:

    No such file or director

    解决方法:注意文件是否正确放在.\model\data 文件夹,检查之前 cd 进入的根目录是否正确。

     

     
    Processed: 0.009, SQL: 8