
Node.js 后端開發指南:搭建、優化與部署
pandas
是一個強大的Python數據分析工具庫,提供了read_csv
函數用于讀取CSV文件。該函數將CSV文件加載為DataFrame對象,DataFrame是pandas中用于存儲和操作結構化數據的一個類。
import pandas as pd
df = pd.read_csv('../data_pro/audito_whole.csv')
print(df)
pandas提供了多種參數來處理不同的CSV文件讀取需求,例如指定列分隔符、處理缺失值等。此外,pandas還支持直接讀取ZIP文件中的CSV文件,這在處理大型數據集時非常有用。
Python標準庫中的csv
模塊提供了讀取CSV文件的功能。csv.reader
是最基本的讀取器,它將CSV文件的每一行讀取為一個列表。
import csv
with open('../data_pro/audito_whole.csv', encoding='utf-8-sig') as f:
csv_reader = csv.reader(f)
for row in csv_reader:
print(row)
csv.DictReader
將CSV文件的每一行讀取為一個字典,其中列名作為鍵,字段值作為值。這對于需要通過列名訪問數據的情況非常有用。
import csv
with open('../data_pro/audito_whole.csv', encoding='utf-8-sig') as f:
for row in csv.DictReader(f, skipinitialspace=True):
print(row)
在處理CSV文件時,我們經常只需要讀取特定的列。使用pandas時,可以直接通過列名選擇需要的列,或者使用列索引。
import pandas as pd
path = 'data.csv'
data = pd.read_csv(path)
x = data'column1', 'column2'
print(x)
讀取特定行的數據也是一個常見的需求。可以通過DataFrame的索引來實現,或者使用csv
模塊的迭代器跳過不需要的行。
import csv
csv_reader = csv.reader(open(