各投标人、潜在供应商,金审学院2025年数据科学与大数据技术专业实验室建设项目经研究作如下更正:
一、更正内容:
1、原“第四章采购项目需求 二、技术要求 2、教学平台(1)大数据技术教学平台功能指标”
序号 | 课程/实训名称 | 主要实验项目 |
1 | 数据采集与预处理 数据采集与预处理实训 | 数据采集 数据预处理 数据可视化 Flume采集与传输 Sqoop转换与处理 【现场演示】 |
2 | 数据库系统 | MySQL数据库基础操作 HBase分布式数据库实验,包括: HBase安装配置 HBase Shell基本操作 用户表设计 HBase Java API创建学生表 HBase Java API创建课程表 |
3 | 数据分析与挖掘 | 分类归纳-决策树 分类归纳-随机森林 分类归纳-贝叶斯 分类归纳-KNN 分类归纳-支持向量机 分类归纳-人工神经网络 聚类分析-KMeans 聚类分析-层次聚类 聚类分析-基于密度 关联分析-Apriori 关联分析-FPGrowth |
4 | 数据分析与挖掘实战 | 支持开展实战项目,例如: P2P网络信贷风险评估(GBM模型) Python爬虫助力疫情数据追踪(Requests) 电力窃漏电用户识别(随机森林) 根据刷卡经纬度信息分析乘客上车站点(DBSCN聚类/OD矩阵) 广电大数据营销推荐(协同过滤) 航空公司客户价值分析(K-Means聚类) 基于数据挖掘的上市公司高送转预测(Lasso回归/随机森林) 家用热水器用户行为分析(BP神经网络) 交通事故成因分析(K-Means聚类/逻辑回归) 竞赛网站智能推荐服务(K-Means聚类) 铁路客流量预测(ARIMA模型) 游客目的地印象分析(LDA/TF-IDF) 自然语言理解实训 【现场演示】 |
5 | 大数据开发与应用 | Hadoop大数据技术基础实验 Spark大数据技术与应用实验(搭建Spark环境、搭建开发环境、编程) |
6 | 实时数据处理技术 实时数据处理技术实训 | Streaming大数据处理实验 Flink 大数据实时处理实验 Kafka数据流处理实验 【现场演示】 |
7 | 数据仓库原理与技术 | Hive安装配置实验 Hive数据仓库操作实验 Hive内外部表创建实验 Hive数据导入导出实验 HQL查询语句实验 |
8 | 深度学习 | 例如: Hadoop电影用户性别预测(Hadoop) Hadoop使用KNN实现鸢尾花分类(Hadoop) 餐饮大数据智能推荐(Spark/协同过滤) 广电大数据用户画像(Spark/SVM) 广电用户标签计算(Hadoop/Spark/Hive) 广告流量作弊识别(Spark/随机森林) 航空客户乘机数据预处理(Hive) 信用贷款风险分析(PySpark/Hive/SparkSQL/SparkMLlib) 竞赛网站目标用户智能识别(SparkMllib) 热门博文实时推荐(Spark Streaming) 网络入侵用户自动识别(Hadoop/Hive/Spark) 用户社交网络分析(Spark GraphX) 芝加哥交通违反记录分析(Hadoop/MongoDB) 【现场演示】 |
9 | 数据可视化技术 | 基本图形(折线图、散点图、饼图、条状图)绘制 关系图(特征关系图、矩阵图)绘制 分析图(分布图、回归图、网格图、地理图等)绘制 实训:分析1996-2015年人口数据特征间的关系 实训:分析1996-2015年人口数据各个特征的分布与分散状况 |
10 | 非结构化大数据分析 非结构化数据处理综合实训 | 数据导入与转换 数据探索 数据预处理与建模 制作词云图 【现场演示】 |
现改为:
序号 | 课程/实训名称 | 主要实验项目 |
1 | 数据采集与预处理 数据采集与预处理实训 | 数据采集 数据预处理 数据可视化 Flume采集与传输 Sqoop转换与处理 【现场演示】 |
2 | 数据库系统 | MySQL数据库基础操作 HBase分布式数据库实验,包括: HBase安装配置 HBase Shell基本操作 用户表设计 HBase Java API创建学生表 HBase Java API创建课程表 |
3 | 数据分析与挖掘 | 分类归纳-决策树 分类归纳-随机森林 分类归纳-贝叶斯 分类归纳-KNN 分类归纳-支持向量机 分类归纳-人工神经网络 聚类分析-KMeans 聚类分析-层次聚类 聚类分析-基于密度 关联分析-Apriori 关联分析-FPGrowth |
4 | 数据分析与挖掘实战 | 包括15项以上实战项目,技术上应覆盖以下类别: 网络数据爬取; 文本处理和统计; 文本情感分析; 文本LDA; 序列推荐(协同过滤或其他算法); 特征工程(变换、选择、降维); 聚类分析(KMeans及其他算法); 关联分析; 分类分析(人工神经网络); 回归分析(线性及Logistic); 集成学习模型; 时间序列分析(AR*模型); 【现场演示】 |
5 | 大数据开发与应用 | Hadoop大数据技术基础实验 Spark大数据技术与应用实验(搭建Spark环境、搭建开发环境、编程) |
6 | 实时数据处理技术 实时数据处理技术实训 | Streaming大数据处理实验 Flink 大数据实时处理实验 Kafka数据流处理实验 【现场演示】 |
7 | 数据仓库原理与技术 | Hive安装配置实验 Hive数据仓库操作实验 Hive内外部表创建实验 Hive数据导入导出实验 HQL查询语句实验 |
8 | 深度学习 | 包括8项以上实战项目,应在以下平台或架构上完成,涉及到对相应技术的应用: Hadoop; Spark; PySpark; Spark GraphX; Hive; MongoDB; Streaming; Spark Mllib; 【现场演示】 |
9 | 数据可视化技术 | 基本图形(折线图、散点图、饼图、条状图)绘制 关系图(特征关系图、矩阵图)绘制 分析图(分布图、回归图、网格图、地理图等)绘制 实训4项:覆盖10种以上不同绘图类型。 |
10 | 非结构化大数据分析 非结构化数据处理综合实训 | 数据导入与转换 数据探索 数据预处理与建模 【现场演示】 |
二、 其余内容不变
三、 凡对本次更正内容提出询问,请按以下方式联系。
项目联系人:张老师
电子邮件:zbb_naujsc@163.com