程序员开发实例大全宝库

网站首页 > 编程文章 正文

数据分析新玩法:无需任何安装,使用SQL轻松分析Excel、CSV 数据

zazugpt 2024-10-20 15:54:56 编程文章 90 ℃ 0 评论

DuckDB 近期已成为最热门的轻量级嵌入式 SQL 引擎之一。凭借其高度集成的列式存储架构、出色的查询性能以及对多种数据格式(如 Excel、CSV、Parquet 等)的广泛支持,DuckDB 正在迅速吸引越来越多的数据分析师关注。DuckDB 在 GitHub 上的星标数量增长迅猛,充分展现了其在业内的高度关注与认可。

DuckDB 作为一款嵌入式 SQL 引擎,不仅支持多种编程语言,如 Python 和 C++,还提供了广泛的灵活性和兼容性。无论是在本地环境还是嵌入到其他应用程序中,DuckDB 都能轻松应对各种数据处理需求。更令人兴奋的是,DuckDB 还支持 WebAssembly 技术,使其能够在浏览器中直接运行。这意味着,用户可以通过 Web 浏览器访问 DuckDB,进行 SQL 查询而无需任何额外的安装,从而实现更高的便捷性和灵活性。这种全方位的支持使 DuckDB 成为一个极具前瞻性的工具,适用于各种数据分析场景。

基于 DuckDB 的 WebAssembly 版本的DuckDB Web Shell(https://shell.duckdb.org/), 提供了一个极为便捷的数据分析工具。只需访问 DuckDB Web Shell 的网址,您即可在浏览器中加载 DuckDB 引擎,直接使用 SQL 进行数据分析。这一无缝的体验让数据处理变得简单而高效。无论是处理本地数据还是进行即时查询,DuckDB Web Shell 都无需任何额外安装,极大地提升了数据分析的便利性和效率。

第一步:打开DuckDB Web Shell

https://shell.duckdb.org/

第二步:添加本地文件

将数据移动到 DuckDB 实例的一种方法是添加本地文件。添加文件的命令是.files add,在 CLI 中输入 .files add 时,浏览器文件对话框窗口会打开,就可以可以选择一个或多个文件(支持 CSV、JSON、Parquet 格式)。

查看的文件列表: .files list

第三步:自由便捷、愉快的数据分析

键入第一个SQL:

select * from 'results1.csv' limit 10;

上百万条数据自由轻松的高效分析:

第四步:下载分析结果

  • copy 命令将sql 的结果保存到csv文件中: copy (SQL ) to csvfile
  • 下载文件: .files download
copy (
    select city,avg(home_score) ,count(*) from 'results1.csv' group by city having count(*) > 7000
   )
   to 'new_results.csv';


.files list


.files download  new_results.csv


DuckDB 作为流行的嵌入式 SQL 引擎,支持多种数据格式,并兼容 Python、C++ 及 WebAssembly。DuckDB Web Shell(https://shell.duckdb.org/)让用户无需安装软件即可在浏览器中直接运行 SQL 查询。只需上传本地文件,使用 SQL 进行数据分析,并可通过 copy 命令保存结果。这种无缝体验极大提升了数据分析的便捷性和效率。

本文暂时没有评论,来添加一个吧(●'◡'●)

欢迎 发表评论:

最近发表
标签列表