- Python数据预处理技术与实践
- 白宁超 文俊 唐聃
- 122字
- 2021-03-26 09:07:32
第4章
文本信息抽取
通过数据采集获取的数据信息往往五花八门、杂乱无章,因此需要对这些不同类型的数据进行集成,并将集成数据传入到电脑中,然后通过算法模型挖掘其潜在的价值,作为智能应用的支撑。本章介绍文本信息抽取技术,以帮助读者更好地利用爬取的数据。
通过数据采集获取的数据信息往往五花八门、杂乱无章,因此需要对这些不同类型的数据进行集成,并将集成数据传入到电脑中,然后通过算法模型挖掘其潜在的价值,作为智能应用的支撑。本章介绍文本信息抽取技术,以帮助读者更好地利用爬取的数据。