首页 >> 计算机科学 >> 文章

b1bbkz

【图为绿坝娘的经典形象】

是不是色情作品,一般人扫一眼心里就有数了。但对电脑来说,它们可不会自己分辨屏幕上那对男女是在谈情说爱,还是在宽衣解带。想让电脑知道哪些东西是不和谐的,还得靠程序员们的调教。不过,想教电脑会看AV并不是一件很容易的事情,因为机器没有七情六欲,没有感情,没有性冲动,唯一能接受的只有各种数据,程序员们要做的,就是让电脑识别色情作品特有的数据特征。

识色、辨形、听声

在计算机中,每张图片里的任何一个点都包括亮度值、色相值、饱和度值,通过这三个值的大小的范围,电脑就能识别出“肉色”,进而猜测出图片里裸露的人体皮肤区域。 而那些“色图”相比于正常图片,最明显的特点就是画面像素中人体皮肤的颜色所占的比例比较大,整张图片比较“黄”,确切地说,研究者发现虽然不同肤色的主角在光线明暗不同环境下拍出来的皮肤颜色不尽相同,但是画面里人体皮肤的颜色总是在一定的范围内。另外,研究人员还发现暴露的区域图片一般纹理值比较小,颜色比较平滑,这也可以作为判断人体皮肤的依据之一。

uofce3

【电脑自动识别出图片里的人体皮肤区域。(图片来自原研究 )】

2126fl

【计算肤色区域的几何关系。(图片来自原研究 )】

当电脑“看到了”图片上有类似于人体皮肤颜色的一些区域之后,需要进一步确定这些区域的来源,看看它们是没穿衣服的女主角,还是来源于正常物体。假设两块黄色区域分别是两条腿或两只胳膊,另外一块区域是人的身体,这些区域的长度值、宽度值必须符合人体的大小比例,之间的位置必须满足一定的几何关系,这些都可以依靠电脑的计算得出结果。如果这些区域之间大小和位置不像是人的身体,就可以排除掉色情图片的嫌疑了。

把肤色和人体构造比例这两招教给电脑是研究者最先想到的解决方案,也是应用得最多的图片自动扫黄方法。凭借这两个简单而有效的主意,美国爱荷华大学和加州伯克利大学的研究人员在1996年发表了一篇名为《找到裸露的身体》( Finding Naked People )的论文(有点标题党的嫌疑)。

后来,世界各国对于此领域情有独钟的研究人员又想出了各种各样提高识别AV图片准确率的方法。

例如斯坦福大学的研究者通过对图片进行“小波分析”(编者按:这只是一个数学方法的名称)可以把色情图片里的人体轮廓提取出来,由于同一个女主角可以被摄像机从不同的角度拍摄,研究者还对提取出的轮廓进行了平移、转动、伸缩的数学变换。接下来,比对被测试的画面提取出的数据和几百张真正色情图片数学变换提取出的信息,两者越接近就说明被测试的图片越可能是色情图片。这样就能让电脑来判定被测试的图片里,不和谐内容出现的概率大小。

94cpqa

【提取图片里的人体轮廓。(图片来自原研究 )】

而中科院自动化研究所的研究人员提出的方法里,为了识别电影里是否有限制级片段,可以先分析一下电影里是否含有限制级的声音。他们收集了592段“声优”的声音片段,然后分析了这些声音信号的十几项参数。根据需要被测试的声音片段的各项参数与这些例子的接近程度,可以计算出一个声音片段是“限制级声音”的概率,如果概率足够大,就要检查声音对应的视频画面有没有问题了。

错杀与漏放

在此类研究中,各个研究论文里都提到了作者测试了大量的样本,收集了包括几百部、上千部高清无码的片子和正常的片子(看来这一类研究做起来还是蛮有意思的……),有的研究识别准确率可以达到90%以上,不过电脑的人工智能还是经常有失手的时候,把正常的画面冤枉成AV画面,或者让真正的“咸湿图片”漏网,市面上此类的软件也都不免有“看走眼”的问题。

比如下面三张图片就是此类软件算法出错的例子,让无辜的图片受冤屈。图片(a)(b)因为整张图片颜色“太黄”了,很像人皮肤的颜色,被电脑误判;图片(c)大老爷们光着膀子的画面让电脑来区分是否属于色情就颇有难度。此外,动物和雕像的图片也容易被错划入不健康图片。

pew8i1

【让电脑迷惑的图片1(图片来自原研究 )】

与此相反,以下三张应该被处理掉的图片却因为背景颜色纹理过多或者清晰度不够高而漏网

npmvf0

【让电脑迷惑的图片2(图片来自原研究 )】

由此可见,要想给视频和图片来个靠谱的自动分级,还需要让电脑更聪明才行。

PS: 相信以后计算机会在这个领域取得新的进展,不过至少目前的常用方法,还是通过征募一些有牺牲精神的壮士,进行人工鉴定来实现的。

PPS:当绿坝娘擦枪走火…… 你懂的,有图有真相。

7k4j9s

参考资料

1.Fleck, Margaret M., David A. Forsyth, and Chris Bregler (1996) “Finding Naked People,” 1996 European Conference on Computer Vision

2. Haiqiang Zuo, Ou Wu, Weiming Hu, Bo Xu;RECOGNITION OF BLUE MOVIES BY FUSION OF AUDIO AND VIDEO 3.Wang, J. and Wiederhold, G. and Firschein, O;System for Screening Objectionable Images Using Daubechies' Wavelets and Color Histograms

原文发表于果壳网(guokr.com性 情 主题站 绿坝娘眼中的AV什么样?
0
为您推荐

49 Responses to “绿坝娘眼中的AV什么样?”

  1. 赵甜说道:

    作为计算机专业的学生,来占这文章的沙发看看

  2. 晨屹说道:

    很好,作为知识普及很到位

  3. leo说道:

    几点看法。
    (1) 如果是针对视频,视频中前后帧的信息(类似于NLP中的互信息模型)也是有用的特征表达。可以对单张图片的的误检进行上下文的验证等……
    (2) 对视频来讲,声音特征是比较有用的。
    (3) 误判是难免的,最终的判断依赖于对训练样本特征的统计分析,由svm或者其他分类模型主刀

  4. s_niper说道:

    炒冷饭...

  5. ZHX说道:

    就算加个娘字,也改不了滤霸的本性的,再说了,问题压根就不是滤不滤

  6. ttt说道:

    最后竟然有个木字,哈哈哈哈

    它竟然能把象形文字识别成画

  7. speaker说道:

    对于和尚来讲,红粉即骷髅;对于程序员来讲,红粉即代码;
    所以程序员≅和尚

  8. pl说道:

    改成绿坝娘和谐你全家更有冲击性。话说这里好像说比对图片的比重更高,av作为影片,只靠截图辨认吗?那么有些电影也会被和谐啊

  9. Xt说道:

    好奇如果是黑人片的话如何......

  10. 小一的博客说道:

    看来这一类研究做起来还是蛮有意思的……哈哈
    http://www.share521.com

  11. 楼哥说道:

    楼上口味真重。。。。

  12. illusiwind说道:

    又见性情の逆袭
    性情酱一统果壳,一统松鼠。

  13. diesirae说道:

    小波的编者按亮了……

  14. 银他妈说道:

    绿坝 绿坝 和谐你全家!

  15. 大连汽车违章查询

  16. 呵呵 这篇文章太有有意思了

  17. 说黑人的那位太有想法了。

  18. 12554说道:

    这简直是,太不可靠了

  19. 方金傲说道:

    话说绿坝娘们的祖辈都是从试管里生出来的么还是。。。。。。。。

  20. momognu说道:

    编者收藏颇丰

  21. messalla说道:

    这个不靠谱 日本Av流仪系列 着衣做爱 我看你怎么和谐 !

  22. pomo酱说道:

    这文章好亮

  23. xx说道:

    搞这么多费劲的东西不如直接做好分级制和管理

  24. 露琪诺说道:

    哈哈~~~~~~~~

  25. 春雨折柳蟹说道:

    总结一句,不用绿坝娘不就得了?已经装了?卸载呀!卸载不了?格式化重装!集成到BOSS里?刷啊。。。。
    绿坝娘(T-T):伦家不就是想电脑上扫个黄,干嘛这样对待伦家?555555555
    技术宅:呃。。。。。。那好吧,我开发个绕过绿坝娘的东东。。。。。。。。。

  26. kkkluanma3说道:

    楼上,boss是什么

  27. Eric说道:

    bios?

  28. 发光二极管说道:

    黑人片。。。老兄真周到

  29. sky吴说道:

    其实不用那么麻烦,堵不如疏,既然有需求那av就是合理的存在。研发所谓的绿坝倒不如花力气规范一下成人网站,严格限制未成年人浏览。这样也许会收到更好的效果

  30. mfktt说道:

    绿坝的作用是将国家项目资金转换成个人财产。跟扫黄功能毛关系都没有。
    请不要在发这种无意义的文章。

  31. Alzard说道:

    所以想过坝娘只要发在豹纹图片前的工口图就可以了吗?

  32. 嘿嘿说道:

    有人相信绿坝娘真是来扫黄的吗?

  33. 看来机器扫黄也不是容易的事情啊!!!

  34. Echowxsy说道:

    乃们淫了。

  35. 荷蛋说道:

    据说绿坝娘还能把大头贴 不知道真的假的 买回来电脑里面有 没敢装

Leave a Reply