报告题目:GoogleFile System
报 告 人:付田原
报告时间:2012年9月14日
报告地点:贵州大学北校区博学楼603室
报告内容摘要:
为了满足谷歌持续快速增长的数据处理需求,Google结合自己的业务特点和传统的分布式文件系统的设计,实现了满足自身需求的全新的分布式文件系统Google File System。
总体来说,GFS的特点可以总结如下:
1、组件的失效被认为是常态事件,而不是意外事件。(容错)
2、以通常的标准来衡量,GFS中的文件都非常巨大。(块大小)
3、绝大部分文件的修改是采用在文件尾部追加数据,而不是覆盖原有数据。
4、应用程序和文件系统的API协同设计提高了整个系统的灵活性。
报告题目:MapReduce:SimplifiedData Processing on Large Clusters
报 告 人:戴震宇
报告时间:2012年9月14日
报告地点:贵州大学北校区博学楼603室
报告内容摘要:
MapReduce is aprogramming model and an associated implementation for processing andgenerating large data sets. Users specify a map function that processes akey/value pair to generate a set of intermediate key/value pairs, and a reducefunction that merges all intermediate values associated with the sameintermediate key.