Mode | Name | Size | |
---|---|---|---|
-rw-r--r-- | Pipfile | 466 | logstatsplain |
-rw-r--r-- | Pipfile.lock | 46995 | logstatsplain |
-rw-r--r-- | README.md | 1109 | logstatsplain |
-rw-r--r-- | TODO | 317 | logstatsplain |
-rwxr-xr-x | backfill_hbase_from_cdx.py | 3112 | logstatsplain |
-rw-r--r-- | common.py | 1886 | logstatsplain |
-rwxr-xr-x | extraction_cdx_grobid.py | 7308 | logstatsplain |
-rwxr-xr-x | grobid2json.py | 4499 | logstatsplain |
-rw-r--r-- | mrjob.conf | 102 | logstatsplain |
-rw-r--r-- | pytest.ini | 171 | logstatsplain |
d--------- | tests | 190 | logstatsplain |
-rw-r--r-- | xml2json.py | 210 | logstatsplain |