大数据的数据处理一共包括四个方面分别是收集,存储,变形,和分析。
收集:原始数据种类多样,格式、位置、存储、时效性等迥异。数据收集从异构数据源中收集数据并转换成相应的格式方便处理。
存储:收集好的数据需要根据成本、格式、查询、业务逻辑等需求,存放在合适的存储中,方便进一步的分析。
变形:原始数据需要变形与增强之后才适合分析,比如网页日志中把IP地址替换成省市、传感器数据的纠错、用户行为统计等。
分析:通过整理好的数据分析whathappened、whyithappened、whatishappening和whatwillhappen,帮助企业决策。