大数据表在多机器分布情况应如何设计及查询?
微博每天产生大量的数据,假设一台机器的数据库只能存 a 亿条微博,但每年要产生 a*50 亿条微博,因此不得不将数据存储到多台机器上,请设计实现一种可行的存储方式,并说明如何实现该环境下的查询需求。
注:不妨设微博信息存储表结构为(id, posttime, content)的结构。
微博每天产生大量的数据,假设一台机器的数据库只能存 a 亿条微博,但每年要产生 a*50 亿条微博,因此不得不将数据存储到多台机器上,请设计实现一种可行的存储方式,并说明如何实现该环境下的查询需求。
注:不妨设微博信息存储表结构为(id, posttime, content)的结构。