本文关于crispdm数据分析的基本流程?,据
亚洲金融智库2024-06-18日讯:
CRISP-DM模型的基本流程包括:
商业理解:
这一步骤旨在从商业角度理解项目的目标和需求,把理解转化为数据挖掘问题的定义和制定以实现目标为目的的初步计划。具体步骤包括:
1、确定业务目标:
分析项目背景,以业务视角分析项目的目标和需求,确定业务角度的成功标准;
2、项目可行性分析:
分析拥有的资源、条件和限制,进行风险、成本和效益的评估;
3、确定数据挖掘目标:
明确数据挖掘的目标和成功标准,数据挖掘目标和业务目标是不一样的,前者指的是在技术上,例如生成一颗决策树。
4、提出项目计划:
对整个项目做一个计划,初步确认用到的技术和工具。
数据理解
数据理解阶段开始于原始数据收集,然后是熟悉数据,表明数据质量问题,探索并初步理解数据,发觉有趣的子集以形成对隐藏信息的假设。具体步骤包括:
1、收集原始数据:
收集项目涉及的数据,如有必要,将数据导入数据处理工具中并做一些初步的数据集成工作,生成相应的报告;
2、数据描述:
对数据进行一些大致描述,例如记录数、属性数等并给出相应的报告;
3、探索数据:
对数据做一些建单的数据统计分析,例如关键属性的分布等;
4、检查数据质量:
包括数据是否完整,是否有错,受有缺失值等。
数据准备
建立模型
模型评估
模型实施
专题推荐: