金审学院2025年数据科学与大数据技术专业实验室建设项目更正公告

发布时间:2025-07-19浏览次数:10文章来源:南京审计大学金审学院

各投标人、潜在供应商,金审学院2025年数据科学与大数据技术专业实验室建设项目经研究作如下更正:

一、更正内容:

1、原“第四章采购项目需求 二、技术要求 2、教学平台(1)大数据技术教学平台功能指标”

序号

课程/实训名称

主要实验项目

数据采集与预处理

数据采集与预处理实训

数据采集

数据预处理

数据可视化

Flume采集与传输

Sqoop转换与处理

【现场演示】

数据库系统

MySQL数据库基础操作

HBase分布式数据库实验,包括:

HBase安装配置

HBase Shell基本操作

用户表设计

HBase Java API创建学生表

HBase Java API创建课程表

数据分析与挖掘

分类归纳-决策树

分类归纳-随机森林

分类归纳-贝叶斯

分类归纳-KNN

分类归纳-支持向量机

分类归纳-人工神经网络

聚类分析-KMeans

聚类分析-层次聚类

聚类分析-基于密度

关联分析-Apriori

关联分析-FPGrowth

数据分析与挖掘实战

支持开展实战项目,例如:

P2P网络信贷风险评估(GBM模型)

Python爬虫助力疫情数据追踪(Requests)

电力窃漏电用户识别(随机森林)

根据刷卡经纬度信息分析乘客上车站点(DBSCN聚类/OD矩阵)

广电大数据营销推荐(协同过滤)

航空公司客户价值分析(K-Means聚类)

基于数据挖掘的上市公司高送转预测(Lasso回归/随机森林)

家用热水器用户行为分析(BP神经网络)

交通事故成因分析(K-Means聚类/逻辑回归)

竞赛网站智能推荐服务(K-Means聚类)

铁路客流量预测(ARIMA模型)

游客目的地印象分析(LDA/TF-IDF)

自然语言理解实训

【现场演示】

大数据开发与应用

Hadoop大数据技术基础实验

Spark大数据技术与应用实验(搭建Spark环境、搭建开发环境、编程)

实时数据处理技术

实时数据处理技术实训

Streaming大数据处理实验

Flink 大数据实时处理实验

Kafka数据流处理实验

【现场演示】

数据仓库原理与技术

Hive安装配置实验

Hive数据仓库操作实验

Hive内外部表创建实验

Hive数据导入导出实验

HQL查询语句实验

深度学习

例如:

Hadoop电影用户性别预测(Hadoop)

Hadoop使用KNN实现鸢尾花分类(Hadoop)

餐饮大数据智能推荐(Spark/协同过滤)

广电大数据用户画像(Spark/SVM)

广电用户标签计算(Hadoop/Spark/Hive)

广告流量作弊识别(Spark/随机森林)

航空客户乘机数据预处理(Hive)

信用贷款风险分析(PySpark/Hive/SparkSQL/SparkMLlib)

竞赛网站目标用户智能识别(SparkMllib)

热门博文实时推荐(Spark Streaming)

网络入侵用户自动识别(Hadoop/Hive/Spark)

用户社交网络分析(Spark GraphX)

芝加哥交通违反记录分析(Hadoop/MongoDB)

【现场演示】

9

数据可视化技术

基本图形(折线图、散点图、饼图、条状图)绘制

关系图(特征关系图、矩阵图)绘制

分析图(分布图、回归图、网格图、地理图等)绘制

实训:分析1996-2015年人口数据特征间的关系

实训:分析1996-2015年人口数据各个特征的分布与分散状况

10

非结构化大数据分析

非结构化数据处理综合实训

数据导入与转换

数据探索

数据预处理与建模

制作词云图

【现场演示】

 

现改为:

序号

课程/实训名称

主要实验项目

1

数据采集与预处理

数据采集与预处理实训

数据采集

数据预处理

数据可视化

Flume采集与传输

Sqoop转换与处理

【现场演示】

2

数据库系统

MySQL数据库基础操作

HBase分布式数据库实验,包括:

HBase安装配置

HBase Shell基本操作

用户表设计

HBase Java API创建学生表

HBase Java API创建课程表

3

数据分析与挖掘

分类归纳-决策树

分类归纳-随机森林

分类归纳-贝叶斯

分类归纳-KNN

分类归纳-支持向量机

分类归纳-人工神经网络

聚类分析-KMeans

聚类分析-层次聚类

聚类分析-基于密度

关联分析-Apriori

关联分析-FPGrowth

4

数据分析与挖掘实战

包括15项以上实战项目,技术上应覆盖以下类别:

网络数据爬取

文本处理和统计

文本情感分析

文本LDA

序列推荐(协同过滤或其他算法)

特征工程(变换、选择、降维)

聚类分析(KMeans及其他算法)

关联分析

分类分析(人工神经网络)

回归分析(线性及Logistic)

集成学习模型

时间序列分析(AR*模型)

【现场演示】

5

大数据开发与应用

Hadoop大数据技术基础实验

Spark大数据技术与应用实验(搭建Spark环境、搭建开发环境、编程)

6

实时数据处理技术

实时数据处理技术实训

Streaming大数据处理实验

Flink 大数据实时处理实验

Kafka数据流处理实验

【现场演示】

7

数据仓库原理与技术

Hive安装配置实验

Hive数据仓库操作实验

Hive内外部表创建实验

Hive数据导入导出实验

HQL查询语句实验

8

深度学习

包括8项以上实战项目,应在以下平台或架构上完成,涉及到对相应技术的应用:

Hadoop

Spark

PySpark

Spark GraphX

Hive

MongoDB

Streaming

Spark Mllib

【现场演示】

9

数据可视化技术

基本图形(折线图、散点图、饼图、条状图)绘制

关系图(特征关系图、矩阵图)绘制

分析图(分布图、回归图、网格图、地理图等)绘制

实训4项:覆盖10种以上不同绘图类型。

10

非结构化大数据分析

非结构化数据处理综合实训

数据导入与转换

数据探索

数据预处理与建模

【现场演示】

 

二、 其余内容不变

三、 凡对本次更正内容提出询问,请按以下方式联系。

项目联系人:张老师

电子邮件:zbb_naujsc@163.com


上一篇:下一篇: