【导读】我们知道,Excel数据导出的上限是100万行,超过100万行的数据,大部分是从系统中导出的数据。导出的时候肯定可以选择文件类型,那么大数据工程师有什么技巧可以导出200万行数据呢?接下来,以记事本和Access作为文件导出类型的示例。
1.导出类型是记事本。
Excel的上限是100万行,所以直接存储200万行数据肯定是不行的,只有加载到数据模型后才能存储。具体操作方法是:
(1)点数据,获取数据,从文件中找到刚才的记事本,从text /CSV中,导入。
(2)用记事本导入时,有时会出现乱码。可以选择文件的原始格式为None,点击转换数据,进入PQ编辑器。
(3)单击关闭并上传到,选择仅创建连接,勾选将此数据添加到数据模型,并确认。请稍等,加载过程需要一些时间。
(4)PP是很多人第一次应该使用的功能,需要加载。在开发工具COM add-in中,找到PP的功能并确认。现在这个新功能出来了。
(5)积分管理:进入PP编辑器,选择里面的透视表,确认后查看负责人、金额、人数。整个操作过程非常流畅,200万行快如20行数据。
2.导出类型是Access
Access本身可以处理大数据,但这里我们演示如何将数据导入Excel。在数据库访问中,有200万行数据,现在我们需要借助Excel来统计每个区域的量。今天就让你看看有多少软件协同工作让Excel变得更强大。具体步骤如下:
(1)新建一个工作簿,点击数据新建查询从数据库从Access数据库,找到数据库并导入。
(2)在导航器中选择200万工作表,点击转换数据(不同版本名称略有不同),稍等片刻进入PQ编辑器。
(3)单击关闭并上传到,选中仅创建连接,将此数据添加到数据模型并加载它。几乎几秒钟的时间,Excel的右侧就显示已经加载了200万行数据,这意味着加载成功,可以进行下一步操作了。
(4)插入透视表,操作和普通透视表几乎一样,最大的区别是不需要选择区域,透视表直接根据数据模型中的数据进行统计。将面积拉至线面积,将金额拉至值面积。第二次统计,没卡。
以上是大数据工程师导出200万行数据的技巧介绍。不管你有100万,200万,甚至300万,都一样。如果加到数据模型里,就不怕大数据了。Excel无法存储。有笔记本和数据库。好好学习。Excel比你想象的更强大。学的快。
内容来源网络,如有侵权,联系删除,本文地址:https://www.230890.com/zhan/179254.html