今日头条的运行模式,就是信息推荐。
具体🄳🁫🈯来说就是把热门或者是🍾🍭用户关注的新闻推送给用户,而且直接将流量导🖝📪向原内容页面,不对新闻做任何处理,其实就是一个更加智能化的搜索引擎。
之前,头条还有编辑,后来吕潇然说了这样会被人诟病,干脆,张🐩🂥🐽亦鸣就撤销了编辑,就原版应用…🛫
怎么推荐?
根据用户的阅读行为、地理位置、职业、年龄等信息挖掘出兴趣;
自然语言处理和图像识别对每条信息提取几十个到几百个高维特征,并对信息进行分类、摘要抽取,🛫主题分析、信息质量识别、敏感词过滤、正能量指数计算等一系列处理;
然后精准推荐根据用🛇🚓户特征、环境特征、文章特征三者的匹配程度进行推荐。
某种意🖯🖊义上🗌🚋👳说这种不构🁕🅬成侵权——本质上是一家技术服务商,而不是内容服务商!
当然,这很🗌🚋👳无耻——因为它将作品上传到自己的服务器内,而当我们阅读今日头条的作品时,我们阅读的是近日头条的服务器的作品,并没有直接导流道其它服务器!
这么🄳🁫🈯说吧,人家辛辛苦苦原创的东西,被你无偿拿来使用,搁谁身上也♢受不了🕕🉡!
关键你还靠着这些阅读量赚钱了!
于是,🖯🖊藤逊、百度、网易、嗖狐,起诉的起诉,谴责的谴责,《🞜🔽🆈新京报》还发了篇社论今日头条是谁的头条?嗖狐、大洋网直接把今日头条给告了!
好,这是大前提!
稍微补充一下,两天前,今日头条b轮融资,直接融资🅱一亿美元,头条估值超过五亿美元,也算是大背景…
……
“律师怎么说?”
张亦鸣“律师说现在的版权很难界定…”
旁边的律师插话“作为🁕🅬一个新闻推荐类应用,今日头条必须先通过计算机爬虫程序在各个新闻网站页面抓取相应的内容,然后才能分析并向用户推荐新闻,那么,其有没有权利抓取新闻网站的内容?根据现在互联网通行的规则,只要被抓取的网站不反对其抓取,即为有权。”
“如果新闻网站反对被爬虫程序抓取的,可以在🞱🗺专供爬虫程序读取的文件内设置白名单或者黑名单,禁止部分爬虫抓取信息或者只允许某些爬虫抓取信息。如果爬虫程序耍流氓,被禁止了还照抓不误,网站可以依据《反不正当竞争法》第二条的规定的起诉通过爬虫程序抓取信息🈧🀪者。”
太多、太长,吕老师没怎么听懂,但他听明白一句话——只要其他网站不反对抓取,即为有权…
“所以,现在搞定了其他🕾🏑🙔网站,就没问题?”
“怎么搞定啊?”
“…挨家挨户拜访,求人原谅,🎜实在不行,给一定的转载费,🄚♬还能怎么搞定?”
律师接着道“两年前新闻网站要求谷🛄🙹🏏歌百度付费索费用,大部分人是反对的,我觉得这个案件很适用现在的情况!”
张亦鸣也说了“根据robots协议…”