Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

Lỗi tách câu #237

Closed
nvlong198 opened this issue Apr 6, 2019 · 2 comments
Closed

Lỗi tách câu #237

nvlong198 opened this issue Apr 6, 2019 · 2 comments
Labels

Comments

@nvlong198
Copy link

input = Cầu thủ Duy Mạnh rất chăm mua đồ hiệu tặng bạn gái.Dựa vào việc Quỳnh Anh tag bạn trai Duy Mạnh vào bức hình, có thể khẳng định rằng đây là món quà mà chàng tuyển thủ dành tặng cho cô bạn gái xinh đẹp. Tuy nhiên, cả chiếc Classic Flap và Gabrielle đều đã được Quỳnh Anh sở hữu từ trước đó nên dễ đoán
output = ['Cầu thủ Duy Mạnh rất chăm mua đồ hiệu tặng bạn gái.Dựa vào việc Quỳnh Anh tag bạn trai Duy Mạnh vào bức hình, có thể khẳng định rằng đây là món quà mà chàng tuyển thủ dành tặng cho cô bạn gái xinh đẹp.', 'Tuy nhiên, cả chiếc Classic Flap và Gabrielle đều đã được Quỳnh Anh sở hữu từ trước đó nên dễ đoán']
expect = ['Cầu thủ Duy Mạnh rất chăm mua đồ hiệu tặng bạn gái.','Dựa vào việc Quỳnh Anh tag bạn trai Duy Mạnh vào bức hình, có thể khẳng định rằng đây là món quà mà chàng tuyển thủ dành tặng cho cô bạn gái xinh đẹp.', 'Tuy nhiên, cả chiếc Classic Flap và Gabrielle đều đã được Quỳnh Anh sở hữu từ trước đó nên dễ đoán']

@rain1024
Copy link
Contributor

Câu này tách sai do từ Dựa không có dấu cách ở trước. Việc này có thể giải quyết bằng cách thực hiện tokenize trước khi tách câu?

Liệu đây có phải là một giải pháp tốt?

@nvlong198
Copy link
Author

Hợp lý, có thể tokenize trước rồi xác định end_of_sentence.

@rain1024 rain1024 mentioned this issue May 8, 2019
16 tasks
Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Labels
Projects
None yet
Development

No branches or pull requests

2 participants