[첫화면으로]유니코드논의

마지막으로 [b]

주인장의 개인 역량으로는 도저히 진전이 불가능하다고 판단됩니다. 관심 있으신 분들은 아래를 채워 주세요.

1. 필요한가?

euc-kr 을 utf-8 로 바꾸는 것은 유용한가요?
이것은 피할 수 없는 문제라고 생각합니다. 위키는 기본적으로 학술적인 용도를 지향하고 있다고 저는 굳게 믿고있는데요, 그것은 아무래도 TFR이 거의 논문 형식을 베꼈기 때문에 그렇게 느껴지는지도 모르겠네요. 그리고 학술적인 용도로 사용될 때 가장 유용하게 사용될 수 있지 않을까 싶네요. 그래서 저는 지금 몇몇 학자들을 꼬드겨보고 있는 중입니다. 얼마나 넘어와줄지는 모르겠지만 가늘고 길게 꼬드겨서 위키로 공부를 하는 문화를 좀 만들어보려고 합니다. 아직 학자들중에는 연필주의자들이 더 많긴 합니다만 :)
한국의 웹사이트들이 죄다 IE만 지원하고있어 편협한 모습을 보이고 있는데...좀 더 보편성을 가진 유즈모드위키가 되었으면 하는 소망이 있습니다.
-- 거북이 2004-5-23 3:41 pm

2. 기존 페이지의 텍스트를 다 바꿔야 하는가?

음 기존 페이지를 일부 안바꿀 수도 있는건가요? 전 이해가 잘 안됩니다만... 기왕이면 일원화되어있는 것이 좋지 않은가 싶어요.
-- 거북이 2004-5-23 3:41 pm

기존의 위키에서 전환하는 경우, data 디렉토리 아래 있는 모든 파일을 iconv 등을 사용해서 일괄적으로 변환해 주면 될 것으로 생각됨.

3. 서버의 파일 시스템과는 전혀 관계없이 바꿀 수 있는가?

저도 잘은 모르지만 페이지 이름으로 파일을 만드는데... 좀 문제가 되지 않을까요?

-- 조프 2004-5-21 4:23 pm
저도 그걸 걱정하고 있습니다.
-- Raymundo 2004-5-21 4:27 pm
생각해보니 브라우저에서 주소줄에 인코딩된 숫자를 날리듯, 페이지 이름을 인코딩해서 저장하면 될 것도 같네요. 일단은 UseMod 1.0 에 구현된 내용을 살펴보는게 맞지 않을까 싶습니다.
-- 조프 2004-5-21 4:31 pm

/파일명인코딩에 대해 정리를 해 봅시다.

4. 위키네임 패턴 등에서 문자 코드 범위를 어떻게 바꾸어 줘야 하는가?

현재는
    $FS  = "\x7f";      # 데이타를 저장할 때 각 필드를 구분하는 문자. 이것도 바꿔줘야 함.
    $FS1 = $FS . "1";   # The FS values are used to separate fields
    $FS2 = $FS . "2";   # in stored hashtables and other data structures.
    $FS3 = $FS . "3";   # The FS character is not allowed in user data.

    # 위키네임 패턴
    $UpperLetter = "[A-Z";
    $LowerLetter = "[a-z";
    $AnyLetter   = "[A-Za-z";
    if ($NonEnglish) {
        $UpperLetter .= "\xc0-\xde";
        $LowerLetter .= "\xdf-\xff";
        $AnyLetter   .= "\xc0-\xff";
    }
    if (!$SimpleLinks) {
        $AnyLetter .= "_0-9";
    }
    $UpperLetter .= "]"; $LowerLetter .= "]"; $AnyLetter .= "]";

    # Main link pattern: lowercase between uppercase, then anything
    $LpA = $UpperLetter . "+" . $LowerLetter . "+" . $UpperLetter
                 . $AnyLetter . "*";
    # Optional subpage link pattern: uppercase, lowercase, then anything
    $LpB = $UpperLetter . "+" . $LowerLetter . "+" . $AnyLetter . "*";

    if ($UseSubpage) {
        # Loose pattern: If subpage is used, subpage may be simple name
        $LinkPattern = "((?:(?:$LpA)?\\/$LpB)|$LpA)";
        # Strict pattern: both sides must be the main LinkPattern
        # $LinkPattern = "((?:(?:$LpA)?\\/)?$LpA)";
    } else {
        $LinkPattern = "($LpA)";
    }

    # 한글을 포함한 free link
    if ($FreeLinks) {
        # Note: the - character must be first in $AnyLetter definition
        #if ($NonEnglish) {
            $AnyLetter = "[-,.()' _0-9A-Za-z\xa0-\xff]";
        #} else {
        #  $AnyLetter = "[-,.()' _0-9A-Za-z]";
        #}
    }
    $FreeLinkPattern = "($AnyLetter+)";
    if ($UseSubpage) {
        $FreeLinkPattern = "((?:(?:$AnyLetter+)?\\/)?$AnyLetter+)";
    }
    $FreeLinkPattern .= $QDelim;

5. 그 외 신경써야 할 것들

브라우저의 URL창에 페이지이름을 한글로 적는 경우 제대로 브라우징이 되는가?

페이지 본문 안에 한글이 포함된 URL이 링크되어 있는 경우 (그림 파일 등) 제대로 처리되는가?

6. 그래서 결국, 소스를 어떻게 바꾸어야 하는가?

usemod1.0 의 코드를 그대로 쓸 수 없는 듯.

7. 참조할 만한 곳

이름:  
Homepage:
내용:  

위키위키분류

마지막 편집일: 2024-4-29 10:14 am (변경사항 [d])
1980 hits | Permalink | 변경내역 보기 [h] | 페이지 소스 보기