报告题目:Kepler+ Hadoop-A General Architecture Facilitating Data-Intensive Applications inScientific Workflow Systems
报 告 人:李宏源
报告时间:2014年4月03日
报告地点:贵州大学北校区博学楼601室
报告内容摘要:
领域科学家是以数据为中心的,数据对领域科学家来说是很重要的。而同时科学计算是数据密集型的,其产生的数据量越来越大;科学大数据成为制约领域科学家继续研究的问题,一部分科学家自己编写程序来处理科学大数据来支持其科学研究,但是对于领域科学家来说,自己编写程序是很困难的,尤其是需要实现比较复杂的功能。MapReduce框架及其开源实现在实现并行操作时有一定的优势,采用工作流技术可以实现编程过程的可视化,运用作死科学计算领域,开源工作流管理引擎Kepler使得使用者加可以只需要点动几下鼠标就可以完成复杂的编程操作。