1.1.1. 가장 자주 불리는 파일들 ¶
웹에서는 노스모크의 기본 모듬이 가장 자주 불린다. 이들의 호출 회수는 총 호출의 74%이상을 차지한다. 그리고 이들의 총 전송량은 총 5% 이상이다. 이들의 주소를 다른 웹 서버로 돌리면 약 5%정도의 트래픽 절감 효과를 볼 수 있다. 만약, 현재 웹 서버의 캐쉬 기능을 이용하고 있다면 큰 효과는 없을 것 같다.
/ns/default.css /ns/upload/nosmokicon.gif /ns/img/moin-help.gif /ns/img/moin-info.gif /ns/img/moin-show.gif /ns/img/moin-print.gif /ns/img/moin-search.gif /ns/img/moin-diff.gif /ns/img/moin-edit.gif /ns/PythonPowered.gif /ns/img/moin-www.gif /ns/img/smile.gif /ns/img/moin-inter.gif /ns/img/smile4.gif /uploads/nomoky.gif /ns/img/smile2.gif /ns/img/sad.gif /ns/img/moin-updated.gif /ns/img/moin-new.gif /ns/img/moin-deleted.gif /ns/img/biggrin.gif /ns/img/smile3.gif /ns/img/rightarrow.gif 기타
가장 많이 불리는 RecentChanges 페이지는 editlog 파일을 읽어들여 해석한 것에 지나지 않는다. 더욱이 파란아이기능도 editlog 파일을 참고한다. 모든 파일의 수정은 editlog 파일에 기록된다. 결국, editlog 파일의 읽기/쓰기 과정이 파일 입출력에 매우 큰 비중을 차지한다는 뜻이 된다.
1.1.3. 응답코드에 따른 분류 ¶
Undefined response code | 2 | 0% |
Code 200 - OK | 2428329 | 66% |
Code 206 - Partial Content | 496 | 0% |
Code 301 - Moved Permanently | 236 | 0% |
Code 302 - Found | 154609 | 3% |
Code 304 - Not Modified | 1088272 | 23% |
Code 400 - Bad Request | 94 | 0% |
Code 403 - Forbidden | 73 | 0% |
Code 404 - Not Found | 9767 | 0% |
Code 405 - Method Not Allowed | 20 | 0% |
Code 408 - Request Timeout | 42 | 0% |
Code 501 - Not Implemented | 22 | 0% |
1.2. 6월 ¶
AutoMate라는 소프트웨어로 노스모크의 모든 페이지를 action=raw해서 받는 중입니다. 노스모크페이지통계까지 나올 수 있는 프로그램을 짤 수 있으면 좋으련만... --PuzzletChung
9시간에 걸친 다운로드가 끝났습니다. ( 받다가 끊겨서... ) 받는 동안 바뀐 부분을 다시 받고 파일 날짜도 고치고 해서 2003년 6월 24일 오전 11시 버전으로 만들었습니다. rar압축하니까 10MB 나오네요.. 필요하시면 PuzzletChung에게 연락해 주세요.
다음은 얼른 볼 수 있는 페이지 통계입니다.
9시간에 걸친 다운로드가 끝났습니다. ( 받다가 끊겨서... ) 받는 동안 바뀐 부분을 다시 받고 파일 날짜도 고치고 해서 2003년 6월 24일 오전 11시 버전으로 만들었습니다. rar압축하니까 10MB 나오네요.. 필요하시면 PuzzletChung에게 연락해 주세요.
다음은 얼른 볼 수 있는 페이지 통계입니다.
- 전체 페이지 5986개, 20105841바이트(19.1MB)입니다.
- 가장 긴 페이지이름: 사랑하면알게되고알면보이나니그때에보이는것은전과같지않으리라
- 가장 긴 영문 페이지이름: GeraldWeinbergOnHowToWinFriendsAndInfluencePeople
- 가장 긴 페이지길이: IsHumanBrainTuringMachine도 아니고, 진화창조토론도 아닙니다. 이 페이지는 홈페이지입니다. 그러면 Menchi나 맑은일까요? 아닙니다. 105511바이트를 차지하는 공산우행입니다.
- 가장 짧은 페이지길이: Serenade와 SystemInfo가 14바이트로 동률입니다. 그 밑으로 redirect, SeeAlso, 그리고 짧은 홈페이지의 연속입니다. 그럼 "내용이 있는" 페이지 중에서 가장 짧은 것은? OppositeGame(25바이트), 좋은비디오(32바이트), 24시간사회(38바이트), UsenetIsNotaBulletinBoard(38바이트) 등등입니다. zeom(33바이트) 페이지는 홈페이지분류가 안 붙어 있군요.
- 파레토법칙: 페이지 용량으로 봤을 때 4761바이트의 모인모인사용팁까지가 전체 페이지의 20%인 1197개가 됩니다. 그 용량은 12790051바이트로 전체의 63.6%입니다.
2.1. 11월 ¶
- 접속한 사람들의 인터넷 주소 개수(접속한 사람수와 비슷): 총 64,041 개(명)
- 하루 평균 방문수(visits): 2,691 회
- 하루 평균 호출 페이지수: 약 18,000 페이지
- 전체 페이지수:
- 9월 대비 두배 이상의 엄청난 신장
위키기사의 영향으로 분석 : 중앙일보기사가 소개된 11월14일은 전날인 13일과 비교할 때, 하루 접속자 수(접속 IP수)가 441에서 1962로 증가했고, 15일엔 5473으로 증가했다. 15일 하루 동안 최소 5473명 이상이 접속했다는 이야기가 될 수 있다. 이후 3500대에서 접속자 수가 유지되다가, 한겨레신문 기사가 소개된 11월 26일은 전날과 비교할 때, 하루 접속자 수가 3535에서 4924로 증가했다.
2.2. 9월 한달간 사용현황 ¶
- 총 접속 횟수(access): 973,027 회
- 접속한 사람들의 인터넷 주소 개수(접속한 사람수와 비슷): 총 20,078 개(명)
- 하루 평균 방문수(visits): 1,300 여회
- 전체 페이지수: 2100 (XXX 페이지 증가)
- 8월 대비 약 20% 이상의 접속량 증가 및 500% 가량의 접속인원(접속 IP 주소) 증가
8월 당시엔 google, wisenut 등의 검색 로봇의 접속으로 총 접속 횟수가 비정상적으로 높았음
2.3. 8월 한달간 사용현황 ¶
- 총 접속 횟수(access): 787,619 회
- 접속한 사람들의 인터넷 주소 개수(접속한 사람수와 비슷): 총 4,163 개(명)
- 7월 대비 약 60% 이상의 접속량 증가 및 200% 가량의 접속인원(접속 IP 주소) 증가
2.5. 7월 한달간 사용현황 ¶
- 7/1부터 7/7까지 사용현황은 제대로 반영되지 않았음에 주의
- 총 접속 횟수(access): 499,782 회
- 접속한 사람들의 인터넷 주소 개수(접속한 사람수와 비슷): 총 2,113 개(명)
- 한 인터넷 주소(한 사람) 당 일주일간 평균 방문 횟수: 약 3.9 회
- 7월 중반 이후로 넘어오면서 접속량이 6월 평균에 비해 약 50% 증가한 것을 볼 수 있다. (8월 초부터는 200% 이상 증가)
- 시간대별 접속률의 도표가 원만한 곡선꼴이 된 것으로 보아, 여러 사람이 다양한 시간대에 골고루 접속하게 되었다는 추측을 할 수 있다.
시간대별 접속률 |
날짜별 접속률 |