リオラボ
icon

⑨PythonでスクレイピングしたデータをCSVファイルに書き出す方法を解説

このブログではPythonを使ったスクレイピングを、初心者向けにサンプルコード付きで解説しています。以下に紹介する記事では、①から⑨のステップでスクレイピングの方法を学び、実践に役立てられるよう体系的にまとめています。

【①〜⑨まとめ】PythonでWebスクレイピングを実践する方法【サンプルコード付き】

【①〜⑨まとめ】PythonでWebスクレイピングを実践する方法【サンプルコード付き】

Posted on 9月 29, 2024 | Category: Python

このブログではPythonスクレイピングを初心者向けに解説していきます。順番に各記事で解説しており入門者向けです。サンプルコード付きで解説するので実践的…


この記事ではPythonスクレイピングで取得したデータをCSVファイルに書き出す方法について解説していきます。

スクレイピングの基本や、データの整形方法などについては以下の記事で解説しています。

①【Requests】BeautifulSoupを使ったスクレイピングの基本を解説【サンプルコード】

①【Requests】BeautifulSoupを使ったスクレイピングの基本を解説【サンプルコード】

Posted on 9月 27, 2024 | Category: Python

このブログではPythonを使ったスクレイピングを、初心者向けにサンプルコード付きで解説しています。以下に紹介する記事では、①から⑨のステップでスクレイピ…

⑧Pythonでスクレイピングしたデータを整形する方法

⑧Pythonでスクレイピングしたデータを整形する方法

Posted on 9月 29, 2024 | Category: Python

このブログではPythonを使ったスクレイピングを、初心者向けにサンプルコード付きで解説しています。以下に紹介する記事では、①から⑨のステップでスクレイピ…


 

サンプルコード全文

以下、解説していきます。

 

コードの解説

 

関数を実行し、戻り値を受け取る

find_links() 関数を実行して、リンクデータを取得します。この関数は、リンク(記事のタイトルやURL)を含む辞書形式のデータリストを返します。結果は links というリストに格納されます。

 

保存先を指定

・save_directory には、保存先のディレクトリを指定しています。
・csv_filename は保存するファイル名です。
・os.path.join(save_directory, csv_filename) を使って、ディレクトリとファイル名を組み合わせたフルパスを生成し、filepath に格納します。これで保存するファイルの完全なパスが得られます。

 

ファイルの存在チェック

・os.path.exists(filepath) を使って、指定した filepathが既に存在するかどうかを確認します。
・ファイルが存在する場合は、”CSVファイルがすでに存在します” というメッセージを出力して処理を終了します。これにより、無駄な上書きやファイル作成を避けることができます。
・os.makedirs(save_directory, exist_ok=True) を使って、指定したディレクトリ(save_directory)が存在しない場合に作成します。exist_ok=True は、既にディレクトリが存在する場合はエラーを発生させないための設定です。

 

CSVに保存する

・open(filepath, ‘w’, newline=”, encoding=’utf-8′) を使って、CSVファイルを「書き込みモード」で開きます。’w’ は書き込みモードを意味し、encoding=’utf-8′ でファイルの文字コードをUTF-8に指定しています。
・csv.writer(csvfile) でCSVファイルに書き込むためのライターオブジェクトを作成します。
・writer.writerow([“id”, “記事タイトル”, “url”]) は、CSVファイルのヘッダー(列の名前)を1行目に書き込みます。この場合、”id”、”記事タイトル”、”url” という3つの列を作成します。
・for link in links: のループ内では、links の各要素(辞書形式)に対して writer.writerow([link[“id”], link[“記事タイトル”], link[“url”]]) を実行し、それぞれのリンク情報をCSVファイルに1行ずつ書き込みます。

このようにして、スクレイピングしたデータをCSVファイルに書き込んでいます。

CSVファイルをMySQLデータベースにインポートする方法は以下の記事で解説しています。

PythonスクレイピングしたデータをMySQLデータベースにインポートする方法を解説

PythonスクレイピングしたデータをMySQLデータベースにインポートする方法を解説

Posted on 10月 1, 2024 | Category: Python

この記事ではPythonでスクレイピングしたデータをMySQLデータベースにインポートする方法を解説しています。 Pythonウェブスクレイピングの基本についてはこ…