Changes to text parser to handle decode errors #3301 #3302

joachimmetz · 2020-11-15T13:20:18Z

Changes to text parser to handle decode errors #3301

codecov · 2020-12-05T16:11:44Z

Codecov Report

Merging #3302 (95cea5c) into master (a6627f4) will increase coverage by 0.00%.
The diff coverage is 92.30%.

@@           Coverage Diff           @@
##           master    #3302   +/-   ##
=======================================
  Coverage   85.94%   85.95%           
=======================================
  Files         376      376           
  Lines       32359    32372   +13     
=======================================
+ Hits        27812    27824   +12     
- Misses       4547     4548    +1

Impacted Files	Coverage Δ
plaso/parsers/text_parser.py	`87.27% <92.30%> (+0.24%)`	⬆️

Continue to review full report at Codecov.

Legend - Click here to learn more
Δ = absolute <relative> (impact), ø = not affected, ? = missing data
Powered by Codecov. Last update a6627f4...95cea5c. Read the comment docs.

Onager · 2020-12-13T16:11:22Z

plaso/parsers/text_parser.py

+              self._current_offset + exception.start))
+
+    escaped = '\\x{0:2x}'.format(exception.object[exception.start])
+    return (escaped, exception.start + 1)


Shouldn't this be exception.end (no +1) instead? I assume start and end will be the same after a 1-byte error, but if there's multiple bytes of invalid data, wouldn't we want to resume parsing at the end of that?

I'm not sure, I took the conservative approach to account for single byte data that might case multi byte decoding errors

plaso/parsers/text_parser.py

Onager · 2020-12-13T16:20:27Z

plaso/parsers/text_parser.py

+              exception.object[exception.start],
+              self._current_offset + exception.start))
+
+    escaped = '\\x{0:2x}'.format(exception.object[exception.start])


This only handles the case of a 1-byte error, are you sure you want 1 exception message per invalid byte?

I took the conservative approach to account for single byte data that might case multi byte decoding errors. We could limit the number of warning that will be generated if you expect a lot of encoding errors.

joachimmetz · 2020-12-22T12:27:33Z

@Onager PTAL

joachimmetz added the blocked Work cannot progress until another issue is resolved label Nov 15, 2020

joachimmetz force-pushed the fix3298 branch from 58c244e to 13aa4b3 Compare November 18, 2020 13:51

joachimmetz requested a review from Onager November 19, 2020 19:13

joachimmetz assigned Onager Nov 19, 2020

joachimmetz marked this pull request as ready for review November 19, 2020 19:13

joachimmetz removed the blocked Work cannot progress until another issue is resolved label Nov 19, 2020

joachimmetz force-pushed the fix3298 branch from 13aa4b3 to 507a417 Compare December 5, 2020 10:13

joachimmetz force-pushed the fix3298 branch from 507a417 to 8e9e987 Compare December 5, 2020 20:43

joachimmetz added this to the 2020 December release milestone Dec 8, 2020

Onager requested changes Dec 13, 2020

View reviewed changes

joachimmetz requested a review from Onager December 22, 2020 12:25

joachimmetz force-pushed the fix3298 branch from 8e9e987 to e29b977 Compare December 22, 2020 12:27

joachimmetz modified the milestones: 2020 December release, 2021 January release Dec 25, 2020

joachimmetz force-pushed the fix3298 branch from e29b977 to 4252b21 Compare January 10, 2021 05:59

Changes to text parser to handle decode errors log2timeline#3301

95cea5c

joachimmetz force-pushed the fix3298 branch from 4252b21 to 95cea5c Compare January 31, 2021 09:33

joachimmetz removed the request for review from Onager February 6, 2021 07:32

joachimmetz assigned joachimmetz and unassigned Onager Feb 6, 2021

joachimmetz merged commit 0e708f4 into log2timeline:master Feb 6, 2021

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Changes to text parser to handle decode errors #3301 #3302

Changes to text parser to handle decode errors #3301 #3302

joachimmetz commented Nov 15, 2020 •

edited

Loading

codecov bot commented Dec 5, 2020 •

edited

Loading

Onager Dec 13, 2020

joachimmetz Dec 22, 2020

Onager Dec 13, 2020

joachimmetz Dec 22, 2020

joachimmetz commented Dec 22, 2020

Changes to text parser to handle decode errors #3301 #3302

Changes to text parser to handle decode errors #3301 #3302

Conversation

joachimmetz commented Nov 15, 2020 • edited Loading

codecov bot commented Dec 5, 2020 • edited Loading

Codecov Report

Onager Dec 13, 2020

Choose a reason for hiding this comment

joachimmetz Dec 22, 2020

Choose a reason for hiding this comment

Onager Dec 13, 2020

Choose a reason for hiding this comment

joachimmetz Dec 22, 2020

Choose a reason for hiding this comment

joachimmetz commented Dec 22, 2020

joachimmetz commented Nov 15, 2020 •

edited

Loading

codecov bot commented Dec 5, 2020 •

edited

Loading