如何在自己电脑构建鉴黄系统!GitHub大佬供计算机学习鉴黄功能的图片数据库
- porn – 色情图片
- hentai – 无尽的图像,但也包括色情图纸
- sexy – 色情图片,但不是色情内容。想想裸体照片,花花公子,比基尼,沙滩排球等。
- neutral – 安全的工作中性图像的日常事物和人
- drawings – 安全的工作图纸(包括动漫)
以下是每个脚本(位于scripts目录下)的作用:
- 1_get_urls.sh- 在scripts/source_urls下载上述5个类别中的每个类别的图像URL 下,遍历文本文件。该Ripme应用程序执行所有繁重的任务。源URL主要是指向各种subreddits的链接,但可以是Ripme支持的任何网站。 注意:我已经为您运行了此脚本,其输出位于raw_data目录中。除非您编辑文件,否则无需重新运行scripts/source_urls
- 2_download_from_urls.sh- 下载raw_data目录中文本文件中找到的URL的实际图像
- 3_optional_download_drawings.sh- (可选)脚本,从Danbooru2018数据库下载SFW动画图像
- 4_optional_download_neutral.sh- (可选)脚本,从Caltech256数据集下载SFW中性图像
- 5_create_train.sh-创建data/train目录,并将所有*.jpg与*.jpeg文件到它raw_data。还会删除损坏的图像
- 6_create_test.sh-创建data/test目录和移动N=2000从随机文件为每个类data/train到data/test(如果你需要一个不同的火车/测试分裂改剧本里面这个数)。或者,您可以多次运行它,每次它都会将N每个类的图像从中移动data/train到data/test。
想要构建一套鉴黄系统,必须有大量的真实图片供计算机进行学习,以便于区分开正常图片和黄色图片。
近期有位加拿大程序员在Github上传了图片列表,里面包含了大量图片地址可以供计算机进行学习。
图片分为几类,正常图,性感图,色情图等,在项目主页有具体的部署和使用方法。
源点击
各文件夹下的txt就是图片文件列表。
内容投诉
- 本作品是由宅次元菌 的投递作品。
- 除特别注明外,本站所有文章均为宅次元原创,转载请注明出处来自https://zhaicy.com/zhaicy/17344
- 如有违规信息请联系邮箱[email protected]删除~
