fix(reverse_sync): roundtrip_verifier에 최소 정규화 추가합니다#906
Merged
Conversation
2 tasks
|
The latest updates on your projects. Learn more about Vercel for GitHub.
|
507bfe0 to
aff822b
Compare
forward converter의 체계적 출력 특성에 의한 차이를 strict 모드에서도 정규화하여 false negative를 줄입니다. - _normalize_consecutive_spaces_in_text: 코드 블록 외 이중 공백을 단일 공백으로 정규화 - _normalize_br_space: <br/> 앞의 공백 제거 - _apply_minimal_normalizations: 위 두 정규화를 항상 적용 (strict/lenient 공통) - 단위 테스트 및 통합 테스트 추가 (22개 테스트 모두 통과) Co-Authored-By: Claude Sonnet 4.6 <noreply@anthropic.com>
aff822b to
e67e470
Compare
- verify_roundtrip 독스트링: strict 모드에서 최소 정규화가 적용됨을 명시 - _apply_minimal_normalizations 독스트링: strict/lenient 공통 적용 범위 설명 추가 - _normalize_consecutive_spaces_in_text 독스트링: inline code span 동작 명시 - 테스트 추가: 코드 블록 전후 텍스트 경계 케이스, inline code span 공백 정규화 Co-Authored-By: Claude Sonnet 4.6 <noreply@anthropic.com>
roundtrip_verifier에 이중 공백 정규화(_apply_minimal_normalizations)가 추가되어 bold 뒤 이중 공백 소실(failure_type=13) 유형 7건이 모두 통과됩니다. - 544145591, 544243925, 544376004: Bold 뒤 이중 공백 소실 - 1453588486: 목록 항목 앞 이중 공백 소실 - 1454342158, 544382060: Bold 뒤 이중 공백 소실 - 544381651: Italic 앞뒤 공백 소실 Co-Authored-By: Claude Sonnet 4.6 <noreply@anthropic.com>
This file contains hidden or bidirectional Unicode text that may be interpreted or compiled differently than what appears below. To review, open the file in an editor that reveals hidden Unicode characters.
Learn more about bidirectional Unicode characters
Sign up for free
to join this conversation on GitHub.
Already have an account?
Sign in to comment
Add this suggestion to a batch that can be applied as a single commit.This suggestion is invalid because no changes were made to the code.Suggestions cannot be applied while the pull request is closed.Suggestions cannot be applied while viewing a subset of changes.Only one suggestion per line can be applied in a batch.Add this suggestion to a batch that can be applied as a single commit.Applying suggestions on deleted lines is not supported.You must change the existing code in this line in order to create a valid suggestion.Outdated suggestions cannot be applied.This suggestion has been applied or marked resolved.Suggestions cannot be applied from pending reviews.Suggestions cannot be applied on multi-line comments.Suggestions cannot be applied while the pull request is queued to merge.Suggestion cannot be applied right now. Please check back later.
Description
verify_roundtrip의 strict 모드에서도 forward converter의 체계적 출력 특성에 의한 차이를 정규화하여 false negative를 줄입니다.추가된 최소 정규화 (strict/lenient 공통 적용):
_normalize_consecutive_spaces_in_text: 코드 블록 외 영역에서 2개 이상 연속 공백을 단일 공백으로 정규화improved.mdx에**bold** :형태의 이중 공백이 있어도 forward converter는 단일 공백으로 출력_normalize_br_space:<br/>앞의 공백 제거' '.join(li_itself)로<br/>앞에 공백을 추가변경하지 않은 것:
_normalize_trailing_ws는 최소 정규화에 포함하지 않음 (strict 모드의 trailing whitespace 검사 보존)Added/updated tests?
TestNormalizeConsecutiveSpaces(5개),TestNormalizeBrSpace(5개), 통합 테스트 3개 추가 — 총 22개 테스트 통과Stacked PRs
이 PR은 stacked PR 시리즈의 일부입니다:
_apply_minimal_normalizations)_normalize_table_cell_padding추가_normalize_trailing_wslenient 모드 이동