최근의 노스모크는 한국 최대의 페이지 숫자와 하루 2천명 이상 방문이라는 거대한 규모로 성장하면서, 초창기에 열명 안팎의 사람들이 활동하며 만들어 낸 노스모크 자체 분류분류 및 지도분류 들의 기능성이 점점 떨어지는 양상을 보이고 있습니다.
이와 관련하여, 현재 RecentChangesPersonalization 같은 토론이 진행 중이며, 대화방에서 미야코, 우산, 퍼키 세 명이서 최근에 공개된 모인모인 0.11 의 기능 중 Comment 기능에 착안하여 아이디어를 낸 '위키키워드' 삽입 방식을 노스모크 페이지 편집에 적용해 보는 것이 어떻겠는가 하는 토론을 가졌습니다.
이와 관련하여, 현재 RecentChangesPersonalization 같은 토론이 진행 중이며, 대화방에서 미야코, 우산, 퍼키 세 명이서 최근에 공개된 모인모인 0.11 의 기능 중 Comment 기능에 착안하여 아이디어를 낸 '위키키워드' 삽입 방식을 노스모크 페이지 편집에 적용해 보는 것이 어떻겠는가 하는 토론을 가졌습니다.
1. 기존 분류방식의 문제점 (분류작업토론) ¶
- 최근엔 업데이트되는 페이지들이 방대하여 현재 RecentChanges 방식의 경우 며칠 내지는 하루라도 접속을 하지 않으면 노스모크의 변화나, 심지어 무슨 글이 새로 생겼는지 놓치기 십상이다. 매일 살펴보지 않으면 노스모키안들간의 의사소통에도 지장이 생기는 현상을 초래할 수 있다.
2.1. 지도분류만 살리기 ¶
- 분류를 다는 것보다 지도를 좀 더 체계적이고 정교하게 만들어서 View 를 제공하는 식으로 링크를 건다.
- 지도만 살리게 되면, 지도를 자주 편집해 줘야 하고 꾸미는 데 노력이 많이 들며, 모을 페이지를 전부 기억하기도 쉽지 않다. (OrphanedPages 증가 우려)
전체를 모은다는 것은 (인간을 위한 데이타일 경우) 그 숫자가 커질 경우 의미가 없어집니다. 그리고, 제 경우 "XX에 속하는 모든 것을 보고 싶다라든가, OrphanedPages가 있으면 안된다"는 강박은 별로 없습니다. 위키 사이트에 대해 좀 느슨, 느긋하다고 할까요. --김창준
3. 편집시 키워드 입력하기 ¶
여러가지 안(案)이 있습니다.:
- 페이지별로 편집할 때 편집창 밑에 키워드 입력창을 만들어, 별도의 인덱스된 형태로 저장하고, 차후에 키워드로 검색하기 쉽도록 한다. 이 방법으로 지도와 분류를 대체할 수도 있고 아니면 분류를 대체하며 지도를 보조하는 형태가 될 수도 있음.
- 페이지의 맨 위줄 부분에
#keywords 물리학,수학,정수론
같이 쓰면 그 내용을 파싱하여 저장될 때 스크립트가 적당히 별도의 키워드DB를 업데이트한다. 업데이트할 때엔 LocalKeywords 페이지에 없는 키워드라면 다시 추가할 지를 물어본다. (모인모인 0.11의 SpellCheck/Preview와 동일한 방법)
3.1. 키워드 입력의 문제점 ¶
현재 분류검색 같은 것들은 Full Text Search를 쓰기 때문에 검색속도도 느리고 RecentChanges에서 분류별로 검색을 한다는 것은 거의 불가능에 가깝습니다. 그러나, 키워드를 별도로 관리하게 되면, 우선 검색 대상이 매우 적어지며 (수백~천 단어로 이루어진 텍스트 대신 10개 미만의 키워드에서 검색), 키워드가 기존의 분류보다는 유동성이 좋기 때문에 (제가 생각한 것으로는 LocalSpellingWords 와 SpellCheck 처럼 닫힌 집단이되 자주 수정이 가능한 형태로 구상했습니다.) 보다 원하는 키워드로 페이지를 찾기가 쉬워집니다. 아울러, 키워드는 데이터 양이 매우 작고 정제되어 있기때문에 RecentChanges에서 자기가 보고 싶은 분류만 선택해서 필터링 해주는 것도 쉽게 가능해집니다.
제가 개인적으로 위키를 사용하면서 느낀것은 "우연적 창발성"이라는 것입니다. 저는 인문학 출신이고 다른 분야에 대하여 별로 관심도, 아는 바도 없었으나 노스모크에서 이런 삶의 자세를 깰 수 있었는데, 그걸 가능하게 했던것이 RecentChanges에 올라오는 무수한, 다양한 방향의 컨텐츠때문이 아니었나 합니다. 별로 선택할 여지도 없이 우연히 발견하는 색다른 분야에 대한 접근기능을 RecentChanges는 제공한다고 봅니다. 특정 분야, 특정 관심사안에 대한 접근을 용이하게 한다면 이런 창발적 우연성을 배제하는 결과를 낳지는 않을까요? 의구심에 질문 올립니다. 우연성과, 정보접근 용이성 두마리 토끼를 다 잡을수는 없는지요. --Jimmy
질문 : 위키키워드를 제안한 분이 생각하는 이 키워드시스템의 문제점은 뭐라고 생각하십니까? 컴맹이 아닌 전문가의 입장에서의 이 시스템의 장단점 설명을 해주셨으면 합니다.
아무래도 이 시스템의 가장 큰 단점은 앞에서 말씀드렸듯이, 쉬워진 분류로 인해 창발적 우연성이 매우 적어질 것이며 RecentChanges가 여러개의 View를 제공하는 것은 노스모크가 모든 사람의 관심이 하나로 집중되는 것이 아닌 각자 자기 하는 일만 열심히 하게 되는 장점에서오는단점이 올 수 있다고 생각합니다.
창발적 우연성은 namespace를 공유함으로 얻는 효과입니다. 창발적 우연성을 얻어내는 더 좋은 방법은 입력된 키워드나 제목과 관련된 페이지를 자동으로 추천해주는 방법이라고 생각합니다. 이 방법은 특히 서로 연관된 페이지를 손쉽게 찾아줌으로써 비슷한 내용의 중복된 페이지가 생성되는 것을 막아주고, 이름이 정확히 동일하지 않더라도 관련된 페이지를 보여주어 더욱 다양한 분야로 관심을 이끌어주는 효과를 얻을 수 있습니다. --Aragorn
4. 키워드 사용 예시 시나리오 ¶
원래의 LocalKeywords 파일에는 다음과 같은 내용이 있었다. (여기서 괄호는 그 키워드를 포함할 경우 자동으로 그 분류에도 들어간다는 뜻으로 사용. 아직 토론의 여지는 많이 남아있음 )
책 언어 한국어{언어} 문화예술 소설{문화예술} 사이언스픽션{소설} 학제적학문 과학 수학{과학} 컴퓨터과학{수학} 생물학{과학} 생명과학{생물학} 유전자{생명과학} 생명정보학{생명과학,학제적학문,컴퓨터과학} 인물 노스모크 노스모키안{인물,노스모크} 아말감{노스모키안} 애완동물 음악
여기서 다음 페이지들이 각각 다음 키워드를 가지고 있었다.
페이지 | 키워드 |
이기적유전자 | 책 유전자 |
생물정보학 | 유전자 |
SimulatedAnnealing | 생명과학 |
CognitiveScience | 학제적학문 |
연세한국어사전 | 책 한국어 |
마술팬티 | 책 사이언스픽션 |
[오로라] (See 오로라) | 애완동물 아말감 |
나는미소년이좋다 | 책 아말감 |
스피츠카피밴드 | 음악 아말감 |
이런 상황에서 만약 과학에 관심이 있는 사람이라면, 이기적유전자, 생물정보학, SimulatedAnnealing가 선택되고 RecentChanges나 실시간으로 키워드서치로 찾을 수 있을 것이다. 책과 한국어 키워드를 모두 갖고 있는 것을 찾으면 연세한국어사전이 찾아질 것이다. 또한, 기존 분류패턴에서는 불가능했던 위의 유전자, 아말감, 애완동물 같은 minor한 분류들도 쉽게 찾을 수 있게 된다. 이런 것이 분류패턴에 대한 장점은 보다 동적인 분류가 가능해서 분류에 엉뚱하게 끼워 넣을 필요가 없다는 점, 풀 텍스트 서치가 필요없다는 점, 보다 다양한 주제로 서치가 가능하다는 점, 매치가 쉬워서 RecentChanges나 TextSearch등에서 정제된 View를 보여줄 수 있다는 점, 분류의 자동 상속 등이 있다.
관련 페이지 설명에 제일 적당한 이유로 예시로 사용하게 되서 송구스럽습니다. 아말감님
헉.. 꽤나 복잡하군요. BillGates 처럼 sophisticated라고 해야 하나... 이 시스템을 별도로 구현해서(이야기꺼낸 퍼키씨가 책임지세요~ ) 몇 달간 사용을 해보고 그 결과를 논의해 보는 게 좋겠네요. --김창준
그럼 이 키워드의 관리는 누군가가 해야 하겠군요. 편리함을 위한 LocalKeywords가 오히려 노스모크에 제약을 가하는 것은 아닐까요?
키워드를 반드시 입력해야 할 필요는 없다고 생각합니다. 궁극적으로는 적절한 키워드를 알아서 위키위키가 알아서 추천해주는 것이겠고, 일단은 누군가 손쉽게 키워드를 입력할 수 있는 인터페이스를 제공해주는 것으로 충분하리라 생각됩니다. IT업계의 큰 화두 중 하나인 KMS, 문서자동분류시스템 등에서 이러한 기능을 구현하고 있고 조금 어려울 뿐, 불가능한 것은 아닙니다. --Aragorn
키워드의 관리나 분류패턴의 관리나 결국 같은 비용을 들이게 되는 것 아닐까요? -- 까리용"조금 어려울 뿐" 허거더덩... 문서자동분류시스템을 연구했었지만, 조금이라기보다는 아주 많이 같습니다. 특히 도메인에 제한이 없으면 말이죠. (Aragorn님은 Computational Liguistics쪽에 공부를 많이 하신 것 같은데, 가름침을 부탁합니다. 꾸벅) 그리고, 적절한 키워드 추천이 가능하다고 해도, 전 사람이 직접 고르는 걸 쓸 것 같습니다. cost-effective-way로 말이죠. --김창준
제가 아는 건 꽁수쓰기의 방법입니다. -_-;;; Linguistics나 Statistics도 제대로 공부한 적 없고요. 직접 사람이 고르긴 하되, 잘 추천해주는 방식이죠. 하이퍼링크가 있는 문서구조에서는 주제어나 비슷한 문서 자동분류 해내기가 훨씬 쉬운 편입니다. 와이즈넛의 문서자동분류기능을 보면 제목의 단어들을 적절히 형태소분석해서 잘 뽑아내어 주더군요. 검색시스템을 구현할 때 문서자동분류기능이 도움이 되는데, 단어나 문장을 보고 유사문서를 판별하는 것보다 하이퍼링크에 의존해서 유사문서를 판별해 내는 것이 더 좋은 효과를 보여주는 것 같습니다. 위키위키의 경우 하이퍼링크가 많기 때문에 상당히 도움이 되리라 생각됩니다.
사실 쓰임새에 있어서는 비슷하거나 동일하지만, 속도가 많이 빨라지고, 더 편리하게 관리할 수 있는 인터페이스를 제공할 수 있습니다. 키워드 정보만이 따로 분리되기 때문에 지금처럼 분류패턴이 본문 중의 일부로 포함되어 자동으로 구분하기 어려운 것보다는 훨씬 좋다고 생각합니다. 누군가 공들여 분류해 놓은 것을 다른 사람이 망친다는 느낌이 훨씬 덜하게 되겠고, 그만큼 분류작업이 쉬워졌다는 것이겠지요. --Aragorn
6. 지도패턴과의 관계 ¶
지도패턴은 지속적인 관리를 해 주지 않으면 쉽게 각 페이지들의 변화를 반영하기 힘들며, 또한 지나치게 많은 내용을 포함하기도 힘들고, Hierarchical한 구조를 가지게 하는 것이 불가능하다. 그러나, 키워드패턴이 도입되더라도, 정리된 지도의 필요성은 여전할 듯 하다.
저는 개인적으로 분류패턴이 사라져도 별 상관이 없을 것이라 봅니다 -- 위키를 사용하면 할 수록 분류보다 지도를 사용하게 됩니다. 키워드를 이용한 분류에서 직접적 효용을 얻으려면 항상 페이지를 만들고 수정할 때마다 분류를 정확히 나눠줘야 하고, 또 그 분류에 해당하는 페이지 숫자가 "인간이 다룰만한" 숫자 이내여야 하고, 키워드에 대한 관리도 좀 더 빡빡하게 이뤄져야 할 겁니다. 지금 논의되고 있는 것의 훨씬 더 발전된 형태인, 키워드와 predicate calculus를 사용해서 formal KMS를 도입한 위키를 봤었는데, 실제로 그 기능을 사용하는 경우가 별로 없었습니다. 키워드를 별도의 공간에 추가하는 것, 그리고 이를 통해 교집합 페이지를 구하는 것의 효용도 의문시 됩니다. 그보다는 페이지 내의 링크를 그대로 키워드로 쓰는 것이 훨씬 더 위키적인 접근법 같습니다. 물론 "위키로 무엇을 하려고 하느냐"에 따라 위키적인 접근법의 효율성이 달라지겠지만요. --김창준
7. 키워드를 사용하는 위키엔진및 참고 사이트 ¶
- http://www.kwiki.org/ : 각 페이지에 대한 키워드 리스트가 같이 보여지며, 키워드를 누르면 그와 관련된 페이지 목록을 찾는다.
- http://search.wikicities.com/wiki/Help:Keyword
- http://openclipart.org/cgi-bin/wiki.pl?Keyword_Organization