文章列表

5k5 分钟

本项目搭建思路: 使用 LLaMA-Factory 微调大语言模型,通过 one-api 转发微调后大语言模型端口,部署 QQ 机器人进行聊天通讯。大体结构图如下所示: 无 GPU 资源的可以参考 如何廉价使用GPU服务器 本机环境: 显卡:2080Ti (11G) OS:Linux # 微调大语言模型 # 下载模型 参考 LLaMA-Factory 的硬件要求,选择你要微调的合适模型。 Method Bits 7B 13B 30B 70B 8x7B 8x22B Full AMP 120GB 240GB 600GB 1200GB 900GB 2400GB Full 1
1.2k1 分钟

记录一下驱动云食用方法。 # 驱动云平台 H100,RTX4090 算力平台,大家可以通过我下面链接注册给我加个餐🤿 注:↓以下接码链接带 aff https://platform.virtaicloud.com/gemini_web/auth/register?inviteCode=4a8db3f4d8842448e96eea414b5be8f0 注册号之后,就可以通过下面接码平台🌈左脚踩右脚低成本接力使用 GPU 资源。 注:↓以下接码链接带 aff【+86 接码】【单价最低 0.1】↓ http://ww
4.5k4 分钟

自学链接👉DeathNote 📣仅用于交流学习,请下载后 24h 之内自行删除。本篇只是记录一下学习途中遇到的一些问题,和自己的解决方法。 本机环境: Node.js: v20.11.1 OS: Ubuntu # didi # 安装依赖 直接运行 didi.js ,会提示缺少 Error: Cannot find module 'got' 依赖,这里不能直接安装 got 依赖,如果直接安装再次运行会报以下错误: Error [ERR_REQUIRE_ESM]: require() of ES Module /*****/node_module
3.4k3 分钟

关于白嫖 You.com 会员各大模型的教程,记录一下[1]。 # 前期准备: 一个好的机场节点,应该随便什么地区的都行(我没用美国的也嫖成了) 信用卡生成服务,Random Credit Card Number Generator for Testing and Development - Namsogen 信用卡检测存活服务,mrchecker.net,或者 https://checker.top/63 (注:很多时候不需要 live 甚至并不需要检测存活就能 C) 一个临时邮箱生成服务,You 虽然不验证邮箱可以乱填,但是建议用真实邮箱。
9.1k8 分钟

构建一个简单 Seq2Seq 模型,通过更改训练数据比例、调整训练参数等对比模型预测效果。 class Encoder(nn.Module): def __init__(self, input_size, hidden_size): super().__init__() self.input_size = input_size self.hidden_size = hidden_size self.lstm = nn.LSTM(self.input_size, self.hidden_size, bat
10k9 分钟

构建一个简单 TCN 模型,通过加更改训练数据比例、调整训练参数等对比模型预测效果。 class Chomp1d(nn.Module): def __init__(self, chomp_size): super(Chomp1d, self).__init__() self.chomp_size = chomp_size def forward(self, x): """ 其实这就是一个裁剪的模块,裁剪多出来的padding """
8.6k8 分钟

构建一个简单 FNN 模型,通过加深模型深度、更改训练数据比例、调整训练参数等对比模型预测效果。 class FNNModel(nn.Module): def __init__(self, input_size, output_size, seq_length): super(FNNModel, self).__init__() self.nn1 = torch.nn.Sequential( nn.Linear(input_size*seq_length, output_size) ) self.nn
6.8k6 分钟

构建一个简单 CNNLSTM 模型,通过更改训练数据比例、调整训练参数等对比模型预测效果。 class CNNLSTM(nn.Module): def __init__(self, input_size, output_size): super(CNNLSTM, self).__init__() out_channels = 32 hidden_size = 16 self.relu = nn.ReLU(inplace=True) # (batch_size=30, s
7.9k7 分钟

构建一个简单 LSTM 模型,通过加深模型深度、更改训练数据比例、调整训练参数等对比模型预测效果。 class LSTMModel(nn.Module): def __init__(self, input_size, output_size): super(LSTMModel, self).__init__() hidden_layer_size=100 self.hidden_layer_size = hidden_layer_size self.lstm1 = nn.LSTM(input_size,
7.8k7 分钟

构建一个简单 CNN 模型,通过加深模型深度、更改训练数据比例、调整训练参数等对比模型预测效果。 class CNNModel(nn.Module): def __init__(self, input_size, output_size, seq_length): super(CNNModel, self).__init__() hidden_channel=64 out_channel=32 kernel_size = 3 stride = 1 p