更新時間:2022-12-15 來源:黑馬程序員 瀏覽量:
大多數情況之下,海量的數據是使用數據庫進行存儲的,這主要是依賴于數據庫的數據結構化、數據共享性、獨立性等特點。因此,在實際生產環(huán)境中,絕大多數的數據都是存儲在數據庫中。Pandas支持MySQL、Oracle、SQLite等主流數據庫的讀寫操作。
為了高效地對數據庫中的數據進行讀取,這里需要引入SQLAlchemy。SQLAlchemy是使用Python編寫的一款開源軟件,它提供的SQL工具包和對象映射工具能夠高效地訪問數據庫。在使用SQLAlchemy時需要使用相應的連接工具包,比如MySQL需要安裝mysqlconnector,Oracle則需要安裝cx_oracle。
Pandas的io.sql模塊中提供了常用的讀寫數據庫函數,具體如表3-3所示。
表3-3 pandas.io.sql模塊常用的函數
在表3-3中列舉了各個函數的具體功能。其中,read_sql_table()函數與read_sql_query()函數都可以將讀取的數據轉換為DataFrame對象,前者表示將整張表的數據轉換成DataFrame,后者則表示將執(zhí)行SQL語句的結果轉換為DataFrame對象。
注意:在連接MySQL數據庫時,這里使用的是mysqlconnector驅動,如果當前的Python環(huán)境中沒有該模塊,則需要使用pip install mysql-connector命令安裝該模塊。