Mode | Name | Size | |
---|---|---|---|
-rw-r--r-- | .coveragerc | 32 | logstatsplain |
-rw-r--r-- | .pylintrc | 245 | logstatsplain |
-rw-r--r-- | Pipfile | 496 | logstatsplain |
-rw-r--r-- | Pipfile.lock | 54889 | logstatsplain |
-rw-r--r-- | README.md | 1265 | logstatsplain |
-rw-r--r-- | TODO | 317 | logstatsplain |
-rwxr-xr-x | backfill_hbase_from_cdx.py | 3073 | logstatsplain |
-rw-r--r-- | common.py | 2010 | logstatsplain |
-rwxr-xr-x | extraction_cdx_grobid.py | 7925 | logstatsplain |
-rwxr-xr-x | grobid2json.py | 5058 | logstatsplain |
-rw-r--r-- | mrjob.conf | 102 | logstatsplain |
-rw-r--r-- | pytest.ini | 171 | logstatsplain |
d--------- | tests | 237 | logstatsplain |
-rw-r--r-- | xml2json.py | 210 | logstatsplain |