九眼系统不能不说的话

热度178票  浏览157次 【共0条评论】【我要评论 时间:2017年7月14日 18:53

近期,我们研发的九眼智能过滤争议很大,引起了不少朋友的关注,完全理解大家对内容审查的恐惧,我们感同身受。前几天群情激奋之下,我说什么大家都很难冷静聆听。今天,我站出来,说几句不得不说的话:自然语言处理与信息检索共享平台M N2gTih2u-LD

1.     九眼智能过滤系统研发背景:去年开始,我们启动了一项研究题目,研究如何从社交网络挖掘网络招赌和假发票贩卖等犯罪行为。中国每年由于赌博而流到境外的赌资超过6000亿元,而且每年剧增,一旦卷入,血本无归,家破人亡(部分新闻: http://gx.sina.com.cn/news/sh/2017-07-13/detail-ifyiakwa3976935.shtml )。具体工作过程中,发现招赌组织者非常狡猾,简单关键词根本不好使,变种特别多,我们实验室没有那么多人手配置规则,因此利用我们在自然语言处理方面的积累,研发了智能过滤程序,发现非常有效,目前发现了几万个赌博网站和大量以前漏掉的招赌信息。

c)i/Qk)Q3z}*NP0

2.     在科研方面,我们一直秉持一个理念,科研不能只在象牙塔里孤芳欣赏,科研人员需要将各种科研成果开放共享,在实际需求中检验并提升,不管收费与否,也算是服务社会的一种形式吧。17年以来,我们一直从事自然语言处理的研究,从2000年开始开源共享,向社会免费共享我们的语义分析技术,目前NLPIR语义分析平台已经免费服务了全球四十万机构,很多研究者与中小企业获益,这也是我们的成就感所在。九眼系统对情报分析与过滤有一定的效果,为此,我们决定不藏私对社会开放,也作为了NLPIR共享平台的一部分,同时,还有分词、搜索等功能。从一开始,九眼就不是为所谓某机构私下开发的工具,就是内部使用起来感觉不错有点用的技术,于是向全社会共享出来。大家完全可以下载九眼的系统与API,免费使用九眼技术解决信息过滤问题,该系统内置了诈骗、传销、网络赌博、色情、反伦理、假发票、邪教胁迫、垃圾广告等词,词库实际上也是开放体系的,可以采用我们的KS_ImportUserDict就可以导入自己关注的关键词词表: https://github.com/NLPIR-team/NLPIR/tree/master/NLPIR%20SDK/KeyScanner自然语言处理与信息检索共享平台{?c6p7k w

3.     为了提高展示度,扩大知晓度,我们从网络公开渠道收集了部分时政类敏感关键词表,内部测试demo的时候采用了政治人物作为比较有显示度的示例,在宣传的时候加入了敏感内容作为示例,实际上给出的几个敏感词都是我们拍脑袋编出来吸引注意力的,这部分仅仅是为了证明能够智能分析各种变种而已,给大家造成不适并误解而致歉。自然语言处理与信息检索共享平台]MyAVf9~9I

4.     需要申明的是,九眼目最近在追查网络赌博,帮工商查小广告,帮消协查夸大宣传的广告。专业应用领域的词库都是用户导入,我们没有用于任何背景下的网络审查,大家可以拍砖该技术可能被用于大家担心的用途,但我们无意做内容审查的背锅侠,大家微博微信或者任何网站的被屏蔽,与我们真的没有任何关系,我们不过是自然语言处理小圈子里的一个研究队伍,这些地方都有自己的强大研发队伍和内容审查队伍。我们作为开放共享的系统,大家都可以用来解决自己的信息分析与过滤,快速智能查找自己需要的各类资料。自然语言处理与信息检索共享平台%t? ZG6eD/_

5.     作为一名普通教师与自然语言处理的研究者,张华平感谢大家的批评指正,没有意愿也没有那个能量成为谁第二,我只是希望做出一些好玩有用的研究探索,在学术界和产业界,我们做的工作还是得到了社会的认可,对学术和技术还是有积极作用的,至少没作恶。希望更多的理性讨论,恳请避免上纲上线,作为研究探索过程,与单位和家人无关。我将一如既往地研究自然语言处理技术,并将研究成果公之于众,为更多公众服务。过程中,我将更加诚惶诚恐地注意应用边界,避免不当示例宣传引发公众的不适。自然语言处理与信息检索共享平台V)U l8u n6b_`p

附件1:九眼发现的假发票与招赌信息

wB6~b\v0

k+[k s@,Hq0
附件2: 正式版本在线展示的结果

~%yShY8p0
顶:5 踩:10
对本文中的事件或人物打分:
当前平均分:-3.88 (42次打分)
对本篇资讯内容的质量打分:
当前平均分:-3.7 (40次打分)
【已经有81人表态】
上一篇 下一篇
发表评论
换一张

网友评论仅供网友表达个人看法,并不表明本网同意其观点或证实其描述。

查看全部回复【已有0位网友发表了看法】