Mode | Name | Size | |
---|---|---|---|
-rw-r--r-- | __init__.py | 1018 | logstatsplain |
-rw-r--r-- | db.py | 15918 | logstatsplain |
-rw-r--r-- | fileset_platforms.py | 1031 | logstatsplain |
-rw-r--r-- | fileset_strategies.py | 549 | logstatsplain |
-rw-r--r-- | fileset_types.py | 1144 | logstatsplain |
-rw-r--r-- | grobid.py | 4531 | logstatsplain |
-rw-r--r-- | html.py | 20841 | logstatsplain |
-rw-r--r-- | html_metadata.py | 30610 | logstatsplain |
-rw-r--r-- | ia.py | 45574 | logstatsplain |
-rw-r--r-- | ingest_file.py | 34008 | logstatsplain |
-rw-r--r-- | ingest_fileset.py | 11949 | logstatsplain |
-rw-r--r-- | ingest_html.py | 14791 | logstatsplain |
-rw-r--r-- | minio.py | 3206 | logstatsplain |
-rw-r--r-- | misc.py | 7048 | logstatsplain |
-rw-r--r-- | pdfextract.py | 17998 | logstatsplain |
-rw-r--r-- | pdftrio.py | 4373 | logstatsplain |
-rw-r--r-- | persist.py | 21042 | logstatsplain |
-rw-r--r-- | workers.py | 22863 | logstatsplain |
-rw-r--r-- | xml.py | 202 | logstatsplain |