大数据

大数据

By  Santiago Ron

[Big Data 大数据中国和香港]

仅仅依靠传统软件是无法处理大数据的,大数据的挑战包括收集,存储,搜索,共享,传递,分析和可视化。 大数据的例子 包括 全球金融数据,互联网文本,大型电子商贸,RFID技术,网络日志,医疗记录,摄影档案,视频档案,传感器网络,社交网络,社会数据,互联网搜索索引,公共数据,呼叫详细记录,天文学,大气科学,基因学,生物化学,生物和其他复杂的跨学科的科学研究。

   

大数据需要特殊的技术,在可容忍的时间内有效地处理海量数据。大数据涉及的技术包括 自然语言处理,模式识别,机器学习,大数据储存和大数据挖掘,行为的预测,需求预测,顾客喜好,个体在群体中的行为,购买历史记录的分析,浏览行为和产品查看分等等,这些技术都是Hadoop的关键优势。

Hadoop 关键的的优势:分布式文件系统的 (Hadoop Distributed Files System HDFS),分布式大数据库 (HBase),完整的大数据工具集 (Complete Set of Big Data Tools),  使用产业标准硬件 (Use Industrial Standard Hardware)

   
  • 能够存储任何类型和任何规模的大数据,不会因为数据太大无法储存而丢失数据
  • 极具成本效益地处理大数据
  • 安心使用 Use with confidence 
  • 大规模实证 Proven at scale
   

Hadoop 家族成员

  • Hadop
    • Hadoop Common: 常用工具集
    • Hadoop Distributed File System (HDFS): 一个分布式文件系统
    • Hadoop MapReduce: 大型并行处理系统 
    • Hadoop YARN: 作业调度和集群资源管理的框架
  • HBase 大数据库
  • Hive 数据仓库
  • Pig 数据挖掘工具集
  • Zookeeper计算机集群同步服务器
  • Mahout 机器学习工具集
  • ......

如果您有任何疑问请随时 与我们联系.

PostgreSQL, Open Source, database, Oracle, SQLServer, MYSQL