使用 Streamlit 在 Web 上进行数据科学
介绍
数据科学涉及使用科学方法提取信息和见解并将其呈现给相关利益相关者。自定义数据科学工具通常以 Python 等语言的程序或脚本形式开发。为了传达他们的见解,数据科学家可能会发现很难共享脚本和程序,尤其是当受众不是技术人员时。他们可能还需要基于网络的资源来接触更广泛的受众。
使用简单、最小的界面在 Web 上执行数据科学的需求催生了开源 Python 库Streamlit。数据科学家、数据分析师、机器学习工程师和商业智能开发人员高度评价 Streamlit 是构建 Web 数据应用程序的最快方法。
本指南将通过示例应用程序探索该库。
假设您是初创公司的数据科学家。您被选中为公司的客户设计和开发一款交互式工具,这家酿酒厂收集了葡萄酒的化学成分数据。该公司希望拥有一个界面,他们可以在其中与数据集交互、根据需要构建简单的可视化效果以及从数据中筛选列。
客户无法参加实体会议,但可以远程会议。他们希望有一个可以进行简单选择的交互式界面。对于此任务,您选择使用 Streamlit 托管界面以与客户共享。
本指南假设您至少具有中级Python 知识并具有一些数据科学经验。
设置
要开始使用 Streamlit,请通过终端中的以下命令下载它。
pip install streamlit
streamlit hello
如果 Streamlit 在浏览器上打开并运行,则表示安装成功。创建一个新的 Python 文件并将其命名为app.py。
示例应用程序
导入所需的库并设置页面标题和欢迎文本。
import streamlit as st
import pandas as pd
st.title("Winery Inc. Welcome")
st.header("Data Visualization Board for Winery Inc Chemical Components")
wine = pd.read_csv("wine_data.csv")
示例数据
以下数据为 CSV 格式,摘录自葡萄酒数据集。生成更多值以构建示例数据集,并将文件保存为wine_data.csv
date,pH,sulphur dioxide,acidity,color
20-11-2019,0.025,2,4,white
21-11-2019,0.015,6,3,red
22-11-2019.0.147,2,7,red
可视化数据框并提供选择用户想要查看的列的选项。
selected_columns = st.multiselect('Select desired Columns', wine.columns.to_list(), default=['acidity','pH'])
st.dataframe(wine[selected_columns])
显示以选定列作为输入的折线图。允许选择使用户能够比较可视化中的多个列。日期列显示记录读数的日期。此列用作图表的索引和X 轴
st.line_chart(wine[selected_columns].rename(columns={'date':'index'}).set_index('index'))
通过上述设置,界面允许用户选择要在数据集和图表中查看的列。
运行项目
要运行你的项目,请在终端上执行以下命令
streamlit run app.py
该项目将在本地地址和端口localhost:8501 的默认浏览器上运行
结论
通过 Streamlit 将数据科学和分析引入网络,您可以轻松与同事和公众分享您的数据科学项目和研究。这项技能最适合数据分析师、数据科学家和商业智能开发人员等职位。
为了进一步了解本指南,请在Heroku上注册一个免费帐户并按照本指南上传您的数据科学机器学习或数据分析项目。
免责声明:本内容来源于第三方作者授权、网友推荐或互联网整理,旨在为广大用户提供学习与参考之用。所有文本和图片版权归原创网站或作者本人所有,其观点并不代表本站立场。如有任何版权侵犯或转载不当之情况,请与我们取得联系,我们将尽快进行相关处理与修改。感谢您的理解与支持!
请先 登录后发表评论 ~