熊貓基本面試問題
讓我們來看看有關 pandas 的一些基本面試問題。友善的面試官可能會從這些簡單的問題開始,以在一開始就安慰你,而其他人可能會問這些問題來評估你對圖書館的基本掌握程度。
1.Python中的pandas是什麼?
Pandas 是一個開源 Python 庫,具有強 保加利亞電話號碼列表 大的內建方法,可以有效地清理、分析和操作資料集。這個強大的軟體包由 Wes McKinney 於 2008 年開發,可以輕鬆地與 Python 中的各種其他資料科學模組混合。
Pandas 建立在 NumPy 函式庫之上,也就是它的資料結構 Series 和 DataFrame 是 NumPy 陣列的升級版本。
2. 如何快速存取 pandas DataFrame 的前 5 行和後 5 行?
pandas 中的方法head()用於存取 DataFrame 的前 5 行,tail() 方法用於存取最後 5 行。
要存取前 5 行: dataframe_name.head()
要存取最後 5 行: dataframe_name.tail()
3.為什麼DataFrame.shape沒有括號?
在 pandas 中,shape是一個屬性而不是方法。因此,您應該在不帶括號的情況下訪問它。
DataFrame.shape輸出一個包含 DataFrame 中的行數和列數的元組。
4. Series 和 DataFrame 有什麼區別?
DataFrame: pandas DataFrame 將採用表格格式,具有多行和多列,其中每列可以是不同的資料類型。
Series: Series是一個一維標記數組,可以儲存任何資料類型,但它的所有值都應該是相同的資料類型。 Series 資料結構更像是 DataFrame 的單列。
Series 資料結構比 DataFrame 消耗更少的記憶體。因此,某些資料操作任務的速度更快。
然而,DataFrame可以儲存大型且複雜的資料集,而Series只能處理同類資料。因此,您可以在 DataFrame 上執行的操作集明顯高於 Series 資料結構。
5. pandas中的索引是什麼?
索引是一系列可以唯一標識 DataFrame 的每一行的標籤。索引可以是任何資料類型,如整數、字串、雜湊等,
df.index列印 DataFrame df 的目前行索引。
中級熊貓面試問題
這些問題將更具挑戰性,而且您更有可能在需要有使用 pandas 經驗的角色中遇到這些問題。
6. pandas 中的多重索引是什麼?
pandas 中的索引唯一指定 DataFrame 的每一行。我們通常選擇能夠唯一標識DataFrame每一行的列並將其設定為索引。但是,如果您沒有可以執行此操作的單一列怎麼辦?

例如,DataFrame 中有「姓名」、「年齡」、「地址」和「標記」欄位。上述任何欄位對於所有不同的行都可能不具有唯一值,並且不適合作為索引。
然而,「名稱」和「位址」列一起可以唯一地標識資料幀的每一行。所以你可以將兩列設定為索引。您的 DataFrame 現在具有多重索引或分層索引。
7. 解釋 pandas 重新索引
pandas 中的重新索引允許我們使用更新的行索引和列標籤從現有 DataFrame 建立一個新的 DataFrame 物件。
您可以向函數 DataFrame.reindex() 提供一組新索引,它將建立一個具有給定索引的新 DataFrame 對象,並從實際 DataFrame 中取得值。
如果原始 DataFrame 中不存在這些新索引的值,則函數將使用預設空值填入這些位置。但是,我們可以將預設值 NaN 更改為我們希望它們填充的任何值。
這是範例程式碼: