[静岡県]自治体WEBサイトにアップロードされたPDFを自動収集するシステムを地元企業と開発 (2022/8/27 株式会社ぎょうせい)
静岡県(368万6300人)立中央図書館は、県内の自治体WEBサイトにアップロードされたPDFを自動収集するクローリングシステムを同県三島市のGeolocation Technology社と共同開発した。21年度から県立中央図書館が行っている「図書館DX実証実験」の一環で、マンパワーをかけて収集していたPDFの自動収集が可能になった。公共図書館におけるクローリングシステムの開発は、全国初の取組みという。
昨今自治体資料は、各自治体のWEBサイトの掲載のみで、紙を発行しない例も多くなり、WEBサイトのみの資料は納本の対象外だった。県中央図書館では、人力で収集していたが、収集漏れや職員の負担の削減と効率化を図り、図書館のDX化推進のため同システムを開発した。
クローリング対象は、県内の自治体WEBサイトのドメイン内に格納されたPDFで、Googleドライブで収集した日付ごと、収集元ドメインと同じディレクトリ構造で保存される。また世代管理も行い、収集したPDFをリネームし管理する。これまで収集できたPDFの数は45万5133件。県は、今後収集したPDFを活かしたサービスの可能性を検証していくという。
(月刊「ガバナンス」2022年7月号・DATA BANK2022)
- 関連記事
- 静岡県の人口・財政・選挙・議員報酬
- [福岡・大牟田市]県境を越える3市1町の共同運営で電子図書館を開館
- [岡山県]中学生のための電子図書館サービスを開始
- [札幌市]「官民データ流通促進基盤」を22年度中に開設
- [福島・玉川村]企業3社と連携協定を締結し、DX推進に向け実証事業などを実施
- 株式会社ぎょうせいは、1893年(明治26年)の創業以来、当社は各行政分野の専門法規集、都道府県・市区町村例規集など多数の行政・自治分野に関わる書籍を発行してきました。「月刊ガバナンス」は、自治体職員の総合情報誌として2001年(平成13年)に創刊し、自治体職員の皆様をはじめ、議員や地方自治に携わる多くの方々にご愛読いただいています。