You signed in with another tab or window. Reload to refresh your session.You signed out in another tab or window. Reload to refresh your session.You switched accounts on another tab or window. Reload to refresh your session.Dismiss alert
Описание проблемы:
Обнаружено некорректное объединение таблиц методом __handle_multipage_table в классе MultiPageTableExtractor. В текущей реализации метод объединяет таблицы, если выполнены следующие условия:
Таблицы имеют одинаковую ширину.
Количество колонок совпадает.
Ширина первой и последней колонок совпадают.
Однако, даже при выполнении этих условий могут возникать случаи, когда объединение является избыточным и некорректным. Например, в прикреплённом документе между таблицами присутствует текстовый слой (более 1 строки текста), что явно свидетельствует о раздельном характере информации в этих таблицах. В результате таблицы, имеющие разные названия и несущие различную смысловую нагрузку, ошибочно объединяются.
Предлагаемое решение:
Добавить дополнительную проверку на наличие текстового слоя между таблицами:
Если между таблицами есть текстовый слой, содержащий более одной строки, объединение таблиц не производится.
Дополнительный контекст:
Это скорее частный случай, и данное issue создано преимущественно для информирования о такой возможности и улучшения логики работы объединения таблиц.
Добрый день!
Описание проблемы:
Обнаружено некорректное объединение таблиц методом
__handle_multipage_table
в классеMultiPageTableExtractor
. В текущей реализации метод объединяет таблицы, если выполнены следующие условия:Однако, даже при выполнении этих условий могут возникать случаи, когда объединение является избыточным и некорректным. Например, в прикреплённом документе между таблицами присутствует текстовый слой (более 1 строки текста), что явно свидетельствует о раздельном характере информации в этих таблицах. В результате таблицы, имеющие разные названия и несущие различную смысловую нагрузку, ошибочно объединяются.
Предлагаемое решение:
Добавить дополнительную проверку на наличие текстового слоя между таблицами:
Дополнительный контекст:
Это скорее частный случай, и данное issue создано преимущественно для информирования о такой возможности и улучшения логики работы объединения таблиц.
Спасибо!
test2.pdf
The text was updated successfully, but these errors were encountered: