今日头条的运行模式,就是信息推荐。
具体来说就是把热门或🙙者是用户关注的新闻推送给☻用户,而且直接将流量导向原内容页面,不对新闻做任何处理,其实就是一个更加智能化的搜索引擎。🇱🜚
之前,头🅴📩条还有编辑,后来吕潇然说了这样会被人诟病,干脆,张亦鸣就撤销了编辑,就原版应用…
怎么推荐?
根据用户的阅读行为、🙙地理位置、🎄🎣💻职业、年龄等🙺信息挖掘出兴趣;
自然语言处理和图像识别对每条🝢信息提取几🈛十个到几百个高维特征,并对信息进行分类、摘要🝀抽取,主题分析、信息质量识别、敏感词过滤、正能量指数计算等一系列处理;
然后精准🅴📩推荐根据用🎫🔃户特征、环境特征、文章特征三者的匹配程度进行推荐。
某种意义🅴📩上说这种不构成侵权——本质上是一家技术服务商,而不📠是内容服务商!
当然,这很无耻——因为它将作品上传到自己的服务器内,而当我们阅读今日头条的作品时,我们阅读的是近日头条的服务器的作品,并没有直接导流道其它🜎🁁🂵服务器!
这么说吧,人家辛辛苦苦原创的东西,被你无偿拿来使用,搁谁🙖身上🄫🀝♘也受不了!
关键你还靠着这些阅读量赚钱了!
于是,藤逊、百度、网易、嗖狐,起诉的起诉,谴责的谴责🌉☹🄕,《新京报》还发了篇社论今日头条是谁的头条?嗖狐、大洋网直接把今🏂🗍日头条给告了!
好,这是大前提!
稍微补充一下,两天前,今日头条b轮融资,直接融资一亿美元,头条估值超过五亿美元,也算是大背🗵☕⚷景…
……
“律师怎么说?”
张亦鸣“律师说现在的版权很难界定…”
旁边的律师插话“作为一个新闻推荐类应用,今日头条必须先通过计算机爬虫程序在各个新闻网站页🛏🝁面抓取相应的内容,然后才能分析并向用🏼🝵户推荐新闻,那么,其有没有权利抓取新闻网站的内容?根据现在互联网通行的规则,只要被抓取的网站不反对其抓取,即为有权。”
“如果新闻网站📾☷🄆反对被爬虫程序抓取的,可以在专供爬虫程序读取的文件内设置白名单或者黑名单,禁止部分爬虫抓取信息或者只允许某些爬虫抓取信息。如果爬虫程序耍流氓,被禁止了还照抓不误,网站可以依据《反不正当竞争法》第二条的规定的起诉通过爬虫程序抓取信息者。”
太多、太长,吕老师没怎么听懂,但他听明白一句话——👿只要其他网站不反对抓取,即为有权…
“所以,现在搞定了其他网站,就没问题?”
“怎么搞定啊?”
“…挨家挨户拜访,求人原谅,实在不行,给一定的转👛载费,还能怎么搞🙩🍁定?”
律🝙师接着道“两年前新闻网站要求谷歌百度付费索费用,大部分人是反对的,我觉得这个案件很适用现在的情况!”
张亦鸣也说了“根据robots协议…”