据可靠消息,百度今日正在秘密地对自己放在网通机房的服务器硬盘进行大规模拆除,这一事件引起了业内的广泛关注及猜测。一时间,众说纷纭,各种猜测纷至沓来。恰好又赶上奥运期间,规定各IDC提供商不允许进行硬件的调整,百度现在进行如此大的动作,难免会招人质疑。有人猜测是不是有了什么非法信息,呵呵,这个猜测很可笑;大多数猜想可能是会放弃传统搜索。这个,我看有点儿可能,毕竟传统搜索的物理存储存在很大的弊端,如果真是这样的话,那百度此次替换固态硬盘的可能将对整个SSD行业产生很大影响。那么还剩下的比较可能的,一个是硬盘更新换代,早在不久前就听说百度很多服务器集群出现了硬盘问题,这个是有可能的,但这样的话,动作岂不是大了点?还有一个就是新的搜索方式或方法出现,比如现在闹的挺热的“云计算”开始投入正式使用?这也是有可能的,除搜索巨头Google公司外,其他包括各大杀软厂商也都在进行“云计算”的尝试,难不成百度已经有了有效的方案?这倒是值得猜测一下,但也不至于牵动机房数据啊。但这项举措甚至在百度公司内部都是机密的,因为,即使联系百度公司公关部,得到的回复都是不置可否。不过,估计这也够Google大中华区负责人想一阵子了,呵呵……
——紫色贵族
作者:未知
近日,有知情人士称,百度正在大规模拆空搜索服务器的硬盘,而这些硬盘一向用来存放百度可以搜索到的全部中文网页和搜索请求。
据了解,在近一个月内,百度已将其安置于网通机房内的搜索服务器的硬盘全数拆除,搬运一空。
实际上,早在今年6月,就有消息称百度服务器硬盘损坏致收录大幅下降一事。当时由于百度的服务器硬件设施跟不上百度全球化战略的发展,已有200多个服务器集群上的文件系统遭到损坏,其中很多集群内的上千台服务器使用的磁盘遭遇物理损坏,数据大量丢失。
目前,百度的数据中心主要有三大核心元素:baidu文件系统(BFS);baidu索引表(souyin Table:是baidu一种对于半结构化数据进行分布存储与访问的接口或服务);MapBeduce算法(它是baidu开发的C++编程工具,用于大于1TB数据的大规模数据集并行运算)。
而对索引数据影响最大的就是baidu文件系统。baidu文件系统处于这三个元素的最底层,它负责许多服务器、机器的数据存储工作。很多baidu文件系统的体积都异常庞大,有好几个petabyte规模(1 petabyte相当于1百万gigabytes)。
从百度技术部门人士处了解到,拆空硬盘的行为有可能意味着百度已经放弃传统搜索的物理存储而开发一种新的存储介质和存储方式,以提高搜索速度的质量,至于是否会采用固态硬盘尚不得而知。但可以肯定的是,如果此次百度采用了固态硬盘(SSD),这对整个服务器及存储行业包括整个SSD行业的发展都将产生深远影响。
在百度内部,这一行动也似乎进行得非常绝密,多次询问百度公关部,得到的回复都是不置可否。
订阅紫色贵族的博客