
大数据采集与预处理训练场始建于2018年12月,是由信息工程学院和华为信息技术有限公司共同建设而成。现有品牌台式机49台,设备总价值约25万元,可容纳44名学生实习、实训。
本训练场主要承担我院《Python程序设计》、《数据采集与预处理》、《网络爬虫技术》等课程的实践教学任务,重点培养“懂采集、精处理、善治理”的复合型数据工程师。
通过实训,学生能够掌握多源数据采集技术;精通数据清洗与转换;具备特征工程能力;熟悉数据质量管控;掌握自动化ETL流程;具备数据安全合规意识。
主要教学项目:
1.网络数据采集
2.Python爬虫采集
3.日志数据采集
4.数据库的数据采集
5.数据预处理
6.flumeNginxPig数据采集预处理综合
7.Python爬虫框架使用