{ "cells": [ { "cell_type": "markdown", "metadata": {}, "source": [ "# Pandas Notes - A Reference" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "The dataset being used here is a sample Sales dataset." ] }, { "cell_type": "code", "execution_count": 1, "metadata": {}, "outputs": [], "source": [ "import pandas as pd\n", "pd.set_option('display.max_rows', 500)\n", "\n", "df = pd.read_csv(\"./data/sales_data_sample.csv\", encoding='Latin-1')" ] }, { "cell_type": "markdown", "metadata": {}, "source": [ "- Get rows with NaNs in any column" ] }, { "cell_type": "code", "execution_count": 2, "metadata": {}, "outputs": [ { "data": { "text/html": [ "
\n", " | ORDERNUMBER | \n", "QUANTITYORDERED | \n", "PRICEEACH | \n", "ORDERLINENUMBER | \n", "SALES | \n", "ORDERDATE | \n", "STATUS | \n", "QTR_ID | \n", "MONTH_ID | \n", "YEAR_ID | \n", "... | \n", "ADDRESSLINE1 | \n", "ADDRESSLINE2 | \n", "CITY | \n", "STATE | \n", "POSTALCODE | \n", "COUNTRY | \n", "TERRITORY | \n", "CONTACTLASTNAME | \n", "CONTACTFIRSTNAME | \n", "DEALSIZE | \n", "
---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
0 | \n", "10107 | \n", "30 | \n", "95.70 | \n", "2 | \n", "2871.00 | \n", "2/24/2003 0:00 | \n", "Shipped | \n", "1 | \n", "2 | \n", "2003 | \n", "... | \n", "897 Long Airport Avenue | \n", "NaN | \n", "NYC | \n", "NY | \n", "10022 | \n", "USA | \n", "NaN | \n", "Yu | \n", "Kwai | \n", "Small | \n", "
1 | \n", "10121 | \n", "34 | \n", "81.35 | \n", "5 | \n", "2765.90 | \n", "5/7/2003 0:00 | \n", "Shipped | \n", "2 | \n", "5 | \n", "2003 | \n", "... | \n", "59 rue de l'Abbaye | \n", "NaN | \n", "Reims | \n", "NaN | \n", "51100 | \n", "France | \n", "EMEA | \n", "Henriot | \n", "Paul | \n", "Small | \n", "
2 | \n", "10134 | \n", "41 | \n", "94.74 | \n", "2 | \n", "3884.34 | \n", "7/1/2003 0:00 | \n", "Shipped | \n", "3 | \n", "7 | \n", "2003 | \n", "... | \n", "27 rue du Colonel Pierre Avia | \n", "NaN | \n", "Paris | \n", "NaN | \n", "75508 | \n", "France | \n", "EMEA | \n", "Da Cunha | \n", "Daniel | \n", "Medium | \n", "
3 | \n", "10145 | \n", "45 | \n", "83.26 | \n", "6 | \n", "3746.70 | \n", "8/25/2003 0:00 | \n", "Shipped | \n", "3 | \n", "8 | \n", "2003 | \n", "... | \n", "78934 Hillside Dr. | \n", "NaN | \n", "Pasadena | \n", "CA | \n", "90003 | \n", "USA | \n", "NaN | \n", "Young | \n", "Julie | \n", "Medium | \n", "
4 | \n", "10159 | \n", "49 | \n", "100.00 | \n", "14 | \n", "5205.27 | \n", "10/10/2003 0:00 | \n", "Shipped | \n", "4 | \n", "10 | \n", "2003 | \n", "... | \n", "7734 Strong St. | \n", "NaN | \n", "San Francisco | \n", "CA | \n", "NaN | \n", "USA | \n", "NaN | \n", "Brown | \n", "Julie | \n", "Medium | \n", "
... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "... | \n", "
2818 | \n", "10350 | \n", "20 | \n", "100.00 | \n", "15 | \n", "2244.40 | \n", "12/2/2004 0:00 | \n", "Shipped | \n", "4 | \n", "12 | \n", "2004 | \n", "... | \n", "C/ Moralzarzal, 86 | \n", "NaN | \n", "Madrid | \n", "NaN | \n", "28034 | \n", "Spain | \n", "EMEA | \n", "Freyre | \n", "Diego | \n", "Small | \n", "
2819 | \n", "10373 | \n", "29 | \n", "100.00 | \n", "1 | \n", "3978.51 | \n", "1/31/2005 0:00 | \n", "Shipped | \n", "1 | \n", "1 | \n", "2005 | \n", "... | \n", "Torikatu 38 | \n", "NaN | \n", "Oulu | \n", "NaN | \n", "90110 | \n", "Finland | \n", "EMEA | \n", "Koskitalo | \n", "Pirkko | \n", "Medium | \n", "
2820 | \n", "10386 | \n", "43 | \n", "100.00 | \n", "4 | \n", "5417.57 | \n", "3/1/2005 0:00 | \n", "Resolved | \n", "1 | \n", "3 | \n", "2005 | \n", "... | \n", "C/ Moralzarzal, 86 | \n", "NaN | \n", "Madrid | \n", "NaN | \n", "28034 | \n", "Spain | \n", "EMEA | \n", "Freyre | \n", "Diego | \n", "Medium | \n", "
2821 | \n", "10397 | \n", "34 | \n", "62.24 | \n", "1 | \n", "2116.16 | \n", "3/28/2005 0:00 | \n", "Shipped | \n", "1 | \n", "3 | \n", "2005 | \n", "... | \n", "1 rue Alsace-Lorraine | \n", "NaN | \n", "Toulouse | \n", "NaN | \n", "31000 | \n", "France | \n", "EMEA | \n", "Roulet | \n", "Annette | \n", "Small | \n", "
2822 | \n", "10414 | \n", "47 | \n", "65.52 | \n", "9 | \n", "3079.44 | \n", "5/6/2005 0:00 | \n", "On Hold | \n", "2 | \n", "5 | \n", "2005 | \n", "... | \n", "8616 Spinnaker Dr. | \n", "NaN | \n", "Boston | \n", "MA | \n", "51003 | \n", "USA | \n", "NaN | \n", "Yoshido | \n", "Juri | \n", "Medium | \n", "
2676 rows × 25 columns
\n", "\n", " | index | \n", "0 | \n", "
---|---|---|
0 | \n", "ORDERNUMBER | \n", "0 | \n", "
1 | \n", "QUANTITYORDERED | \n", "0 | \n", "
2 | \n", "PRICEEACH | \n", "0 | \n", "
3 | \n", "ORDERLINENUMBER | \n", "0 | \n", "
4 | \n", "SALES | \n", "0 | \n", "
5 | \n", "ORDERDATE | \n", "0 | \n", "
6 | \n", "STATUS | \n", "0 | \n", "
7 | \n", "QTR_ID | \n", "0 | \n", "
8 | \n", "MONTH_ID | \n", "0 | \n", "
9 | \n", "YEAR_ID | \n", "0 | \n", "
10 | \n", "PRODUCTLINE | \n", "0 | \n", "
11 | \n", "MSRP | \n", "0 | \n", "
12 | \n", "PRODUCTCODE | \n", "0 | \n", "
13 | \n", "CUSTOMERNAME | \n", "0 | \n", "
14 | \n", "PHONE | \n", "0 | \n", "
15 | \n", "ADDRESSLINE1 | \n", "0 | \n", "
16 | \n", "ADDRESSLINE2 | \n", "2521 | \n", "
17 | \n", "CITY | \n", "0 | \n", "
18 | \n", "STATE | \n", "1486 | \n", "
19 | \n", "POSTALCODE | \n", "76 | \n", "
20 | \n", "COUNTRY | \n", "0 | \n", "
21 | \n", "TERRITORY | \n", "1074 | \n", "
22 | \n", "CONTACTLASTNAME | \n", "0 | \n", "
23 | \n", "CONTACTFIRSTNAME | \n", "0 | \n", "
24 | \n", "DEALSIZE | \n", "0 | \n", "