对于非注册用户,像淘宝那样的网站,他们是如何获取我以前在他们网站的一些浏览记录来作推荐的,是通过用户IP吗?还是通过浏览器的cookie?
对于已注册的用户,那么就应该是把他们的各种动态记录到数据库里面了?这样产生的数据量貌似会挺大的?
大数据
匿名浏览者可以利用cookie,记录一些重要的访问浏览、搜索记录。
登录用户除了上面的,主要根据购买记录,可以测算用户兴趣、偏好等。
至于怎么记录、记录在哪,简单高效就行,并充分利用现有数据。
如何进行数据分堆比较有效率?
关于 Storm 的 Spout 组件的生命周期问题
hadoop上java
做数据etl相关工作的各位工程师都踩过那些坑?
python有哪些提取文本摘要的库?
大数据如何入门?爬虫软件有哪些?相关的网站或者聚集地是在哪里?