A CSV (wartości oddzielone przecinkami) plik jest formą dokumentu tekstowego, w którym zastosowano określony format do uporządkowania informacji tabelarycznych. Format pliku CSV to ograniczony dokument tekstowy, w którym wartości są rozróżniane za pomocą przecinka. Każdy wiersz w dokumencie jest dziennikiem danych. Każdy dziennik składa się z jednego lub większej liczby pól oddzielonych przecinkami. Jest to najpopularniejszy format plików służący do importowania i eksportowania arkuszy kalkulacyjnych i baz danych.
Czytanie pliku CSV
Istnieją różne sposoby odczytywania pliku CSV Pyton korzystające z modułu CSV lub biblioteki pandas.
- moduł csv: Moduł CSV jest jednym z modułów w Pythonie, który udostępnia klasy do odczytywania i zapisywania informacji tabelarycznych w formacie pliku CSV.
- Biblioteka pand: Biblioteka pandas to jedna z bibliotek języka Python typu open source, która zapewnia wydajne, wygodne struktury danych oraz narzędzia i techniki analizy danych do programowania w języku Python.
Odczytywanie formatu pliku CSV w Pythonie:
Rozważ poniższy plik CSV o nazwie „Giganci.CSV” :

Korzystanie z csv.reader()
Najpierw plik CSV jest otwierany za pomocą metody otwarty() metoda w trybie „r” (określa tryb odczytu podczas otwierania pliku), która zwraca obiekt pliku, a następnie jest odczytywana przy użyciu metody reader() modułu CSV, która zwraca obiekt czytnika, który iteruje po wierszach określonego dokumentu CSV.
Notatka: The 'z' słowo kluczowe jest używane razem z metodą open(), ponieważ upraszcza obsługę wyjątków i automatycznie zamyka plik CSV.
polecenie zip w systemie Linux
Przykład: Ten kod odczytuje i drukuje zawartość pliku CSV o nazwie „Giants.csv” używająccsv>moduł w Pythonie. Otwiera plik w trybie odczytu, odczytuje wiersze i drukuje je jeden po drugim za pomocą afor>pętla. The csv.reader()> funkcja służy do odczytu pliku CSV, a dane z każdego wiersza są drukowane na konsolę.
Python3
import> csv> with>open>(>'Giants.csv'>, mode>=>'r'>)as>file>:> >csvFile>=> csv.reader(>file>)> >for> lines>in> csvFile:> >print>(lines)> |
>
>
stała Java
Wyjście:
['Organization', 'CEO', 'Established'] ['Alphabet', 'Sundar Pichai', '02-Oct-15'] ['Microsoft', 'Satya Nadella', '04-Apr-75'] ['Amazon', 'Jeff Bezos', '05-Jul-94']>
Korzystanie z klasy csv.DictReader().
Jest to podobne do poprzedniej metody, plik CSV jest najpierw otwierany za pomocą metoda open(). następnie jest odczytywany przy użyciu klasy DictReader modułu csv, który działa jak zwykły czytnik, ale odwzorowuje informacje z pliku CSV na słownik. Pierwsza linia pliku składa się z kluczy słownika.
Przykład: Ten kod odczytuje i drukuje zawartość pliku CSV o nazwie „Giants.csv” za pomocącsv>moduł zDictReader>. Otwiera plik w trybie odczytu, czyta wiersze i drukuje je jeden po drugim.csv.DictReader()>odczytuje plik CSV i traktuje pierwszy wiersz jako nagłówki, tworząc słownik dla każdego wiersza, którego kluczem są wartości nagłówka. Kod drukuje każdy wiersz jako słownik, co ułatwia pracę ze strukturalnymi danymi CSV.
Python3
sortuj listę tablic
import> csv> with>open>(>'Giants.csv'>, mode>=>'r'>) as>file>:> >csvFile>=> csv.DictReader(>file>)> >for> lines>in> csvFile:> >print>(lines)> |
>
>
Zamiana ciągu Java
Wyjście:
OrderedDict([(„Organizacja”, „Alfabet”), („CEO”, „Sundar Pichai”), („Założona”, „15 października ′)])
OrderedDict([(„Organizacja”, „Microsoft”), („CEO”, „Satya Nadella”), („Założona”, „04-kwietnia-75′)])
OrderedDict([(„Organizacja”, „Amazon”), („CEO”, „Jeff Bezos”), („Założona”, „05-lip-94′)])
Korzystanie z metody pandas.read_csv().
Odczytanie pliku CSV przy użyciu funkcji biblioteki pand jest bardzo łatwe i proste. Tutaj metoda read_csv(). of pandas służy do odczytu danych z plików CSV.
Przykład: Ten kod używapandas>biblioteka do odczytu i wyświetlenia zawartości pliku CSV o nazwie „Giants.csv.” Odczytuje plik CSV i zapisuje go jako DataFrame za pomocą pandas.read_csv()> funkcjonować. Na koniec drukuje całą ramkę DataFrame, która zapewnia uporządkowaną i tabelaryczną reprezentację danych CSV. Jest to powszechne podejście podczas pracy z danymi tabelarycznymi w Pythonie, nppandas>oferuje potężne narzędzia do manipulacji i analizy danych.
Python3
stos Javy
import> pandas> csvFile>=> pandas.read_csv(>'Giants.csv'>)> print>(csvFile)> |
>
>
Wyjście:
Organization CEO Established 0 Alphabet Sundar Pichai 02-Oct-15 1 Microsoft Satya Nadella 04-Apr-75 2 Amazon Jeff Bezos 05-Jul-94>
Notatka: Aby dowiedzieć się więcej o pandas.csv_read() Kliknij tutaj .