一个简单易用的AI生成内容检测工具,可以帮助您识别文档中可能由AI生成的内容。
本项目使用 uv 作为Python包管理和运行工具。uv是一个快速的Python包安装器和解析器,由Rust编写,可大幅提升依赖项安装速度。
如果您还没有安装uv,可以通过以下命令安装:
curl -sSf https://install.ultraviolet.rs | sh
或在Windows上使用PowerShell:
iwr https://install.ultraviolet.rs/ps1 | iex
克隆仓库后,使用uv安装依赖:
uv pip install -e .
- 支持中文和英文内容的AIGC检测
- 多模型融合检测,提高准确率
- 支持多种文件格式(.txt和.docx)
- 自动语言检测,针对不同语言选择最佳模型
- 支持长文本分块处理
- 提供友好的命令行界面和彩色输出
- 支持多种预训练模型选择
- 可自定义AI内容判定阈值
- 优化的多模型结果融合算法,对不同语言优化处理
uv run .\src\main.py 文件路径 [选项]
-m, --model
: 选择检测模型类型,可选值:multi
(默认):使用多模型组合检测chinese
:仅使用中文AIGC检测模型english
:仅使用英文AIGC检测模型desklib
:仅使用Desklib通用检测模型
-t, --threshold
: AI内容判定阈值,默认为0.7(大于此值则判定为AI生成)
检测单个文件(使用多模型检测):
uv run .\src\main.py .\example.txt
检测多个文件:
uv run .\src\main.py file1.txt file2.docx
使用英文检测模型:
uv run .\src\main.py .\example.txt --model english
自定义判定阈值:
uv run .\src\main.py .\example.txt --threshold 0.8
multi
: 多模型组合检测(推荐),综合多个模型结果提高准确率chinese
: 中文AIGC检测模型english
: 英文AIGC检测模型desklib
: Desklib通用检测模型
本工具使用了多种预训练模型进行AI生成内容检测:
- AIGC中文模型:基于BERT的中文AI内容检测模型
- AIGC英文模型:基于RoBERTa的英文AI内容检测模型
- Desklib模型:通用AI文本检测模型
多模型检测模式下,工具会同时使用多个模型进行评估,并通过加权投票算法综合各模型的检测结果,提高检测的准确性和鲁棒性。对于不同语言类型的内容,系统会自动调整不同模型的权重,优先考虑针对该语言优化的模型结果。
- Python 3.8+
- transformers
- torch
- python-docx
- typer
- rich
- huggingface-hub
- numpy
首次运行时,工具会自动从Hugging Face下载预训练模型,并缓存到本地。这可能需要一些时间,请耐心等待。后续运行将使用本地缓存的模型,启动更快。
MIT
欢迎提交问题和合并请求,共同改进这个项目!