Mode | Name | Size | |
---|---|---|---|
-rw-r--r-- | __init__.py | 1042 | logstatsplain |
-rw-r--r-- | db.py | 15918 | logstatsplain |
-rw-r--r-- | fileset_platforms.py | 27541 | logstatsplain |
-rw-r--r-- | fileset_strategies.py | 10931 | logstatsplain |
-rw-r--r-- | fileset_types.py | 1932 | logstatsplain |
-rw-r--r-- | grobid.py | 4531 | logstatsplain |
-rw-r--r-- | html.py | 20841 | logstatsplain |
-rw-r--r-- | html_metadata.py | 31111 | logstatsplain |
-rw-r--r-- | ia.py | 46636 | logstatsplain |
-rw-r--r-- | ingest_file.py | 33399 | logstatsplain |
-rw-r--r-- | ingest_fileset.py | 19177 | logstatsplain |
-rw-r--r-- | ingest_html.py | 14791 | logstatsplain |
-rw-r--r-- | minio.py | 3206 | logstatsplain |
-rw-r--r-- | misc.py | 9156 | logstatsplain |
-rw-r--r-- | pdfextract.py | 17998 | logstatsplain |
-rw-r--r-- | pdftrio.py | 4373 | logstatsplain |
-rw-r--r-- | persist.py | 21081 | logstatsplain |
-rw-r--r-- | workers.py | 22863 | logstatsplain |
-rw-r--r-- | xml.py | 202 | logstatsplain |