À¥ ·Îº¿¿¡ ´ëÇÑ Áú¹® ¹× ´ë´ä (FAQ)
¸¶Áö¸· º¯°æµÈ ½Ã°£: 1996³â 2¿ù 9ÀÏ (4¿ù 30ÀÏ ¹ø¿ª)
¿øÀúÀÚ: Martijn Koster
À§Ä¡: http://aistar.kotel.co.kr/~hiongun/robots/faq.html
- À¥ ·Îº¿¿¡ ´ëÇؼ
- »öÀÎÈ ·Îº¿
- ¼¹ö ¿î¿µÀÚ¸¦ À§Çؼ
- ·Îº¿ ¹èÁ¦Çϴ ǥÁØÀûÀÎ ¹æ¹ý
- »ç¿ë°¡´É¼º
À¥·Îº¿¿¡ ´ëÇؼ
·Îº¿À̶õ ÀÚµ¿ÀûÀ¸·Î À¥ÀÇ ÇÏÀÌÆÛÅؽºÆ® ±¸Á¶¸¦ µû¶ó ´Ù´Ï¸ç ¹®¼¸¦
ÃßÃâÇÏ°í, Àç±ÍÀûÀ¸·Î ±× ¹®¼¿¡¼ ÂüÁ¶µÇ´Â ´Ù¸¥ ¹®¼µéÀ» ÃßÃâÇÏ´Â
½ÄÀ¸·Î µ¿ÀÛÇÏ´Â ÇÁ·Î±×·¥ÀÌ´Ù.
¿©±â¼ "Àç±ÍÀû"À¸·Î µ¿ÀÛÇÑ´Ù´Â °ÍÀÌ µû¶ó´Ù´Ï´Â ¾Ë°í¸®µëÀÌ Àç±ÍÀûÀ̶ó´Â
¶æÀÌ ¾Æ´Ï´Ù. ¾à°£ÀÇ ÈÞ¸®½ºÆ½À¸·Î ¹®¼¸¦ ¼±ÅÃÇÏ´Â ¼ø¼°¡ ´Þ¶óÁú ¼ö ÀÖÁö¸¸
±×·¡µµ ±×°Í ¿ª½Ã ·Îº¿À̶ó ÇÒ ¼ö ÀÖ´Ù.
º¸Åë À¥ºê¶ó¿ìÁ®´Â ·Îº¿ÀÌ ¾Æ´Ï´Ù. ¿Ö³ÄÇÏ¸é ±×°ÍµéÀº ¸Å¹ø
¸µÅ©¸¦ µû¶ó ´Ù´Ò ¶§¸¶´Ù »ç¶÷ÀÌ ÀÛµ¿½ÃÅ°±â ¶§¹®ÀÌ´Ù. ·Îº¿Àº ÀÚµ¿À¸·Î
¸µÅ©¸¦ µû¶ó´Ù´Ï´Â ÇÁ·Î±×·¥À» ¸»ÇÑ´Ù.
À¥ ·Îº¾Àº º¸Åë À¥ ¹æ¶ûÀÚ(Wanderer), ±â¾î´Ù´Ï´Â °Í(Crawler), ȤÀº
½ºÆÄÀÌ´õ(Spider, °Å¹Ì)·Î ºÒ¸®±âµµ ÇÑ´Ù. ÀÌ À̸§ ¶§¹®¿¡ ¼ÒÇÁÆ®¿þ¾î
ÀÚü°¡ ¹ÙÀÌ·¯½ºÃ³·³ µ¹¾Æ´Ù´Ï´Â °ÍÀ¸·Î ¿ÀÇظ¦ »ç´Â °æ¿ì°¡ Àִµ¥,
±×·¸Áö ¾Ê´Ù. ·Îº¿ ÇÁ·Î±×·¥ ÀÚü´Â ÇÑ°÷¿¡ ¸Ó¹°·¯ ÀÖ°í, ´ÜÁö ¼·Î ´Ù¸¥
»çÀÌÆ®·ÎºÎÅÍ ¹®¼¸¦ ÀÐÀ¸¿Ã µû¸§ÀÌ´Ù.
ÃÖ±Ù Àü»êÇп¡¼´Â "¿¡ÀÌÀüÆ®"¶ó´Â ¸»ÀÌ ¿©·¯°¡Áö Àǹ̷Π¾²ÀδÙ. ¿¹¸¦ µé¸é:
- ÀÚµ¿ ¿¡ÀÌÀüÆ®
- ´Â »çÀÌÆ®µé »çÀ̸¦ µ¹¾Æ´Ù´Ï¸ç ÀÚ½ÅÀÌ ¾ðÁ¦ ´Ù¸¥ µ¥·Î ¿Å°Ü´Ù´ÒÁö, ¹«¾ùÀ»
ÇؾßÇÒ Áö¸¦ °áÁ¤ÇÑ´Ù. (¿¹¸¦ µé¸é,
General Magic's
Telescript).
À̰͵éÀº ´ÜÁö Ư¼öÇÑ ¼¹öµé (¾ÆÁ÷ ÀÎÅͳݿ¡ ³Î¸® ÆÛÁöÁö´Â ¾ÊÀº) »çÀÌ¿¡¸¸
¿Å°Ü´Ù´Ò ¼ö ÀÖ´Ù.
- Áö´ÉÈµÈ ¿¡ÀÌÀüÆ®
- ¶õ »ç¿ëÀÚ°¡ ¹°°ÇÀ» °í¸¦ ¶§³ª, ¹®¼ ¼½ÄÀ» ä¿ö ³Ö¾î¾ß ÇÒ ¶§³ª,
ȤÀº ¹º°¡¸¦ ¹ß°ßÇÒ ¶§¿¡ »ç¿ëÀÚ¿¡°Ô µµ¿òÀ» ÁÖ´Â ÇÁ·Î±×·¥À» ¸»ÇÑ´Ù.
º¸Åë ³×Æ®¿÷°ú´Â º°·Î °ü°è°¡ ¾ø´Ù.
- User-agent (»ç¿ëÀÚ ¿¡ÀÌÀüÆ®)
- ÀÌ°ÍÀº »ç¿ëÀÚ¿¡°Ô ƯÁ¤ÇÑ ³×Æ®¿öÅ· ÀÛ¾÷À» ÇØÁÖ´Â ÇÁ·Î±×·¥¿¡ ºÙÀÌ´Â
±â¼úÀûÀÎ ¿ë¾îÀÌ´Ù. ¿¹¸¦ µé¾î¼ Netscape Explorer´Â À¥ User-agentÀÌ°í
QualcommÀÇ Eudora´Â email User-agentÀÌ´Ù.
°Ë»ö¿£ÁøÀ̶õ ¾î¶² ÀÚ·áÁýÇÕ¿¡¼ °Ë»öÀ» ¼öÇàÇØÁÖ´Â ÇÁ·Î±×·¥À¸·Î¼ À¥ºÐ¾ß¿¡¼´Â
"°Ë»ö¿£Áø"À̶ó´Â ¸»ÀÌ ÈçÈ÷µé ·Îº¿¿¡ ÀÇÇØ ¸ð¾ÆÁø HTML¹®¼µéÀÇ µ¥ÀÌŸº£À̽º
·ÎºÎÅÍ °Ë»öÀ» ÇØÁÖ´Â °ÍÀ» ¸»ÇÑ´Ù.
·Îº¿Àº ´Ù¾çÇÑ ¿ëµµ¸¦ À§Çؼ ¾²ÀδÙ:
- »öÀθ¸µé±â
- HTML üũÇϱâ
- Link üũÇϱâ
- "What's New" °¨½ÃÇϱâ
- ¹Ì·¯¸µ(Mirroring):¶È °°Àº º¹»çº»(°Å¿ï»ó) ¸¸µé±â
ÇöÀç È°µ¿ÁßÀÎ ·Îº¿µéÀÇ ¸®½ºÆ®¸¦ ÂüÁ¶ÇÏ¿© ·Îº¿µéÀÌ
¹» ÇÏ´ÂÁö ¾Ë¾Æº¸¶ó. ÇÊÀÚ¿¡°Ô ¹¯Áö ¸»¶ó -- ÇÊÀÚ°¡ ¾Æ´Â °ÍÀº ¸®½ºÆ®¿¡ ÀÖ´Â °ÍÀÌ
ÀüºÎÀÌ´Ù....
°ÅÀÇ °°Àº Á¾·ùÀÇ °ÍÀ» ¸»ÇÏ´Â °ÍÀÌÁö¸¸ ±»ÀÌ Â÷À̸¦ ¸»ÇÏÀÚ¸é...
- ·Îº¿
- ÀϹÝÀûÀÎ À̸§. ·Îº¿À̶õ ÂüÁ¶.
- ½ºÆÄÀÌ´õ
- ·Îº¿°ú °°´Ù. ´Ü ¾ð·Ð¿¡¼´Â ´õ ½Å¼±ÇÏ°Ô µé¸°´Ù.
- ¹ú·¹
- ·Îº¿°ú °°´Ù. ±â¼úÀûÀ¸·Î´Â ¹ú·¹´Â ·Îº¿°ú´Â ´Þ¸® º¹Á¦ÇÏ´Â ÇÁ·Î±×·¥À» ¶æÇÑ´Ù.
- À¥ Å©·Î¿ï·¯
- ·Îº¿°ú °°´Ù. ÇÏÁö¸¸ WebCrawler¶ó°í
Çϸé ƯÁ¤ÇÑ ·Îº¿À» °¡¸®Å²´Ù.
- À¥°³¹Ì
- ºÐ»êµÇ¾î¼ ¼·Î Çùµ¿ÇÏ´Â ·Îº¿µéÀ» ¸»ÇÑ´Ù.
»ç¶÷µéÀÌ ·Îº¿À» À¥°ø°£¿¡¼ Çطοî Á¸Àç¶ó°í ¹Ï´Â ÀÌÀ¯°¡ ¸î°¡Áö ÀÖ´Ù:
- ¾î¶² ·Îº¿µéÀº À߸ø ±¸ÇöÇÏ¿© (°ú°Å¿¡´Â) ³×Æ®¿÷À̳ª ¼¹ö¿¡ °úºÎÇϸ¦
°Å´Â °æ¿ì°¡ ÀÖ¾ú´Ù. ÀÌ°ÍÀº º¸Åë ÀÌÁ¦ ¸· ·Îº¿À» Á¦ÀÛÇϱ⠽ÃÀÛÇÑ »ç¶÷µé
ÀÇ ½Ç¼ö·Î ±âÀÎÇϴµ¥, ¿äÁò¿¡´Â ÀÌ·± ½Ç¼ö¸¦ ¸·À» ÃæºÐÇÑ Á¤º¸°¡ ÀÖ´Ù.
- ¶§·Î´Â ·Îº¿ÀÌ ¼³Ä¡¸¦ Àß ¸øÇÏ´Â »ç¶÷À̳ª, ±×µéÀÇ Çൿ¿¡ ÆıÞÈ¿°ú¸¦
¸ð¸£´Â »ç¶÷µé¿¡ ÀÇÇØ µ¿À۵DZ⵵ ÇÑ´Ù. µû¶ó¼ ·Îº¿ Á¦ÀÛÀÚ´Â ¸Å¿ì¸Å¿ì
Á¶½ÉÇÏ¿© ½Ç¼ö³ª À߸øµÈ °á°ú°¡ ³ª±â Èûµéµµ·Ï À¯³äÇØ¾ß ÇÑ´Ù.
- À¥¿¡ °ÉÃļ »öÀÎÀ» ¸¸µå´Â ·Îº¿µéÀº Áß¾ÓÁýÁᫎ ¹®¼ µ¥ÀÌŸ º£À̽º¸¦
±¸ÃàÇϴµ¥ ¼ö¹é¸¸ »çÀÌÆ®¿¡ °ÉÃļ ºÐ»êµÇ¾î ÀÖ´Â ¼ö¹é¸¸ ÆäÀÌÁö¸¦ Àß
´Ù·çÁö ¸øÇÏ´Â °æ¿ì°¡ ÀÖ´Ù.
±×·¯³ª µ¿½Ã¿¡ ¼ö¸¹Àº ·Îº¿µéÀÌ Àß ¼³°èµÇ¾î¼ Àü¹®°¡¿¡ ÀÇÇØ µ¿À۵ǹǷΠ¾Æ¹«·±
¹®Á¦µµ ¾ß±âÇÏÁö ¾Ê´Â´Ù. ±× ·Îº¿ÀÌ Àֱ⿡ ¸î¸î °¡Ä¡ÀÖ´Â ¼ºñ½ºµéÀÌ °¡´ÉÇØÁ³´Ù.
µû¶ó¼ ·Îº¿Àº ±Ùº»ÀûÀ¸·Î ÇØ·Î¿î °Íµµ, ±Ùº»ÀûÀ¸·Î ¶È¶ÈÇÑ °Íµµ ¾Æ´Ï´Ù.
´ÜÁö ¼¼½ÉÇÑ ÁÖÀÇ°¡ ÇÊ¿äÇÑ ´ë»óÀÏ µû¸§ÀÌ´Ù.
À¥·Îº¿ Ȩ ÆäÀÌÁö°¡ ÀÖ´Ù.
http://info.webcrawler.com/mak/projects/robots/robots.html
¸¹Àº ·Îº¿ »çÀÌÆ® Áß¿¡¼ Çϳª¸¦ °¡¸®Å°°í ÀÖÁö¸¸, Ä¡¿ìÄ¡Áö ¾ÊÀº
Á¤º¸¸¦ ÃæºÐÈ÷ ¸¹ÀÌ °¡Áö°í ÀÖ´Ù.
¹°·Ð FAQÀÇ °¡Àå ÃÖ±Ù ¹öÀüµµ °Å±â¿¡ °¡¸é ±¸ÇÒ ¼ö ÀÖ´Ù.
¸ÞÀϸµ ¸®½ºÆ®¿¡ °¡ÀÔÇÏ¸é ´õ ¼¼¹ÐÇÑ Á¤º¸¿Í ·Îº¿µéÀÌ ÃàÀûµÇ¾î ÀÖ´Â °÷À»
ãÀ» ¼ö ÀÖ°í °Å±â¿¡¼´Â ·Îº¿¿¡ ´ëÇÑ ±â¼úÀûÀÎ Åä·ÐÀÌ ÀÌ·ïÁö°í ÀÖ´Ù.
»öÀÎ ·Îº¿
·Îº¿¿¡ µû¶ó ´Ù¸£´Ù. °¢°¢ÀÇ ·Îº¿Àº ¼·Î ´Ù¸¥ Àü·«À» »ç¿ëÇϱ⠶§¹®ÀÌ´Ù.
ÀϹÝÀûÀ¸·Î´Â ¾î¶² URL¸®½ºÆ®·Î ºÎÅÍ ½ÃÀÛÇϴµ¥, ƯÈ÷ ¼¹ö¸®½ºÆ®³ª
"What's New"ÆäÀÌÁö°°ÀÌ ¿ÜºÎ·Î ³ª°¡´Â ¸µÅ©µéÀÌ ¸¹Àº ÆäÀÌÁö¿¡¼
½ÃÀÛÇÑ´Ù. ±×¸®°í °¡Àå À¯¸íÇÑ ÆäÀÌÁö¿¡¼ ½ÃÀÛÇÑ´Ù.
»öÀÎ ¼ºñ½ºÀÇ °æ¿ì ´ëºÎºÐ »ç¿ëÀÚ URLÀ» ¼öµ¿À¸·Î µî·ÏÇÏ´Â ¹æ¹ýÀÌ
ÀÖÀ¸¹Ç·Î ÀÚ½ÅÀÇ URLÀ» µî·ÏÇÏ¿© ·Îº¿À¸·Î ÇÏ¿©±Ý ¹æ¹®Çϵµ·Ï
¸¸µé ¼ö ÀÖ´Ù.
´Ù¸¥ URLµéµµ ÀÌ¿ëÇϴµ¥, ¿¹¸¦ µé¾î À¯Áî³Ý ´º½º±×·ì¿¡ ¿Ã¶ó¿Â
±ÛµéÀ» ÈȾîºÁ¼ ³ªÅ¸³ª´Â URLÀ» »ç¿ëÇϰųª, ¸ÞÀϸµ ¸®½ºÆ®ÀÇ
¹®¼ÀúÀåµÈ °÷À» ÀÌ¿ëÇÏ¿© »õ·Î¿î URLµéÀ» ã±âµµ ÇÑ´Ù.
Ãâ¹ßÁ¡ÀÌ µÇ´Â URLÀÌ ÁÖ¾îÁö¸é ·Îº¿Àº ±× ¸µÅ©¸¦ µû¶ó °¡¼ ¹æ¹®ÇÏ°í
»öÀÎÀ» ¸¸µé°í ¶Ç ±× ¹®¼¸¦ ÀÐ¾î¼ »õ·Î¿î URLÀ» ã¾Æ³½´Ù.
·Îº¿ÀÌ ¾î¶² ¹®¼¸¦ °¡Áö°í ¿À¸é ±× ¹®¼¸¦ Çؼ®ÇÏ°í, ±× °á°ú¸¦
µ¥ÀÌŸº£À̽º¿¡ ³ÖÀ» °ÍÀÌ´Ù. ±×·¯³ª ÀÌ °úÁ¤ÀÌ ¾î¶»°Ô ÁøÇàµÇ´ÂÁö´Â
·Îº¿¸¶´Ù ´Ù¸£´Ù: ¾î¶² ·Îº¿Àº HTMLÁ¦¸ñ¸¸, ȤÀº ¸î ¹®´Ü¸¸, ȤÀº
Àüü HTMLÀ» Çؼ®ÇÏ¿© ¸ðµç ´Ü¾î¸¦, °¡ÁßÄ¡ Á¤µµ¿¡ µû¶ó¼ »öÀÎÈÇÑ´Ù.
¾î¶² ·Îº¿Àº ¸ÞŸ(META)ű׳ª Ưº°ÇÑ ¼û°ÜÁø ű׸¦ ÀÌ¿ëÇϱ⵵
ÇÑ´Ù.
¿øÄÁ´ë À¥ÀÌ ÁøÈÇÔ¿¡ µû¶ó¼ ¸ÞŸ µ¥ÀÌŸ¸¦ °ü·ÃÁöÀ» ¸¸ÇÑ È¿À²ÀûÀÎ
¹æ¾ÈÀÌ ´õ ¸¹¾ÆÁö±â¸¦ ¹Ù¶õ´Ù. ¿¹¸¦ µé¾î ¹®¼µéÀÇ »öÀÎÁ¤º¸ °°Àº °ÍµéÀÌ.
ÀÌ¿¡ °üÇÑÇÑ ÁøÇàµÇ°í ÀÖ´Ù...
ÃßÃøÇغ¸¶ó. ¼ºñ½º¸¶´Ù ´Ù¸£´Ù. ´ëºÎºÐÀÇ ¼ºñ½º¿¡¼´Â
ÆäÀÌÁö µî·ÏÇÏ´Â ¼½ÄÀÌ ÀÖ´Â ÆäÀÌÁö¸¦ Á¦°øÇÏ°í ÀÖ´Ù.
´ÙÇེ·´°Ôµµ ¸ðµç ¼ºñ½º¿¡ ÀÏÀÏÀÌ ¼ÕÀ¸·Î µî·ÏÇÒ ÇÊ¿ä°¡ ¾ø´Ù:
ÇѲ¨¹ø¿¡ µî·Ï½ÃÅ°±â
<URL: http://www.submit-it.com/>¸¦ »ç¿ëÇϸé ÇѲ¨¹ø¿¡
µî·Ï½Ãų ¼ö°¡ ÀÖ´Ù.
¼¹ö ¿î¿µÀÚ¸¦ À§Çؼ
¼¹öÀÇ ·Î±×ÆÄÀÏÀ» »ìÆìºÁ¼ ªÀº ½Ã°£¿¡ ¸¹Àº ¹®¼¸¦ Àо °ÍÀ» ã¾Æ³»¸é
µÈ´Ù.
¸¸¾à ´ç½ÅÀÇ ¼¹ö°¡ User-agent·Î±ëÀ» Áö¿øÇϸé Á» ÀÌ»óÇÑ User-agent¸¦
ãÀ¸¸é µÉ °ÍÀÌ´Ù.
¸¸¾à ´©±º°¡°¡ /robots.txt¸¦ ¹Ýº¹ÀûÀ¸·Î Á¢±ÙÇϸé, ¾Æ¸¶ ·Îº¿ÀÏ °¡´É¼ºÀÌ
Å©´Ù.
À½... ¾Æ¹«°Íµµ ÇÒ ÀÏÀÌ ¾ø´Ù. ±âº»ÀûÀ¸·Î ±×°ÍµéÀº ÀÚµ¿À¸·Î µ¿ÀÛÇϴϱî.
¾Æ¹«Àϵµ ÇÒ ÇÊ¿ä°¡ ¾ø´Ù.
¸¸¾à »õ·Î¿î ·Îº¿À» ¹ß°ßÇß´Ù°í »ý°¢Çϸé (±×¸®°í ·Îº¿ ¸®½ºÆ®¿¡ ¾øÀ¸¸é)
È°µ¿ÁßÀÎ ·Îº¿ ¸®½ºÆ®,
¸¸¾à ±×°ÍÀÌ "°¡²û¾¿"À̶ó°í Çϱ⿡´Â ³Ê¹« ÀÚÁÖ µé¸£´Â °æÇâÀÌ ÀÖÀ¸¸é
ÇÊÀÚ¿¡°Ô ¾Ë·ÁÁֱ⠹ٶõ´Ù. ³ªÁß¿¡ ÂüÁ¶ÇÒ ¼ö ÀÖ°Ô. ±×·¸´Ù°í Çؼ
´ç½ÅÀÇ È£½ºÆ®¿¡ µé¸£´Â ¸ðµç È£½ºÆ®¸¦ ¾Ë·ÁÁÖÁö´Â ¸»¶ó!
±×·± Çö»óÀ» º¸°í "rapid-fire"(°úÁ¢¼Ó)À̶ó°í ºÎ¸£´Âµ¥, °¨½Ã¸¦ ÇÏ°í ÀÖ´Ù¸é
ȤÀº ·Î±× ÆÄÀÏÀ» ºÐ¼®ÇÏ°í ÀÖ´Ù¸é ¹ß°ßÇÒ ¼ö ÀÖ´Ù.
¸ÕÀú ¼¹öÀÇ ºÎÇϸ¦ üũÇÏ°í, ¼¹öÀÇ ¿¡·¯·Î±× ÆÄÀÏÀ» °¨½ÃÇÏ°í, ÇöÀçÀÇ
¿¬°á»óŵéÀ» üũÇÑ´Ù. ¸¸¾à Áß»óÀ§ ÆÄ¿ö¸¦ °¡Áø ¼¹ö¶ó¸é, ÃÊ´ç ¸î°ÇÀÇ
Á¢¼Óµµ ÃæºÐÈ÷ °¨´çÇÒ ¼ö ÀÖ´Ù. ƯÈ÷ Á¢±ÙÀÌ Àçºü¸¦ ¶§¿¡´Â.
±×·¯³ª ¼º´ÉÀÌ ³·Àº »çÀÌÆ®¿¡¼´Â ¸¹Àº ¹®Á¦°¡ »ý±æ ¼ö Àִµ¥, ¿¹¸¦ µé¾î
°³Àοë ÄÄÇ»Åͳª ¸ÅŲÅä½Ã°°Àº °æ¿ì¿¡´Â ¼º´ÉÀÌ ³·Àº ¼¹ö¼ÒÇÁÆ®¿þ¾î°¡ ±ò·Á ÀÖÀ»
¼öµµ ÀÖ°í, ¶ÇÇÑ CGI½ºÅ©¸³Æ®³ª Ä¿´Ù¶õ ¹®¼¸¦ Àбâ À§ÇØ ¾à°£ Àå±â°£ÀÇ
Á¢¼ÓÀÌ ÀÖÀ» ¼öµµ ÀÖ´Ù. ÀÌ·± ¹®Á¦µéÀº ±× ÀÚü·Îµµ Á¢¼ÓÀ» °ÅÀýÇϴµ¥¸¸
³ôÀº ºÎÇÏ, ¼º´ÉÀúÇÏ°°Àº °ÍÀ» ¾ß±âÇÑ´Ù. ÃÖ¾ÇÀÇ °æ¿ì ½Ã½ºÅÛÀÌ Å©·¡½ÃµÇ´Â
°æ¿ìµµ ÀÖ´Ù.
ÀÌ·± °æ¿ì¿¡ ÇؾßÇÒ ÀÏÀÌ ¸î°¡Áö Àִµ¥, °¡Àå Áß¿äÇÑ °ÍÀº ¸ÕÀú ±â·ÏÀ»
½ÃÀÛÇÏ´Â °ÍÀÌ´Ù. ¾ðÁ¦ ¾Ë¾ÆÂ÷·È°í, ¹«½¼ ÀÏÀÌ ÀϾ°í, ·Î±×ÆÄÀÏ¿¡
¹¹¶ó°í ¾²¿© ÀÖ°í, ±× ´ëÀÀÀ¸·Î ´ç½ÅÀÌ ¹» Çß´ÂÁö µîµîÀ» ±â·ÏÇÑ´Ù.
ÀÌ·¸°Ô ÇØ¾ß ³ªÁß¿¡ ¹®Á¦°¡ ¹«¾ùÀÎÁö¸¦ Á¶»çÇϴµ¥ µµ¿òÀÌ µÈ´Ù.
µÎ¹ø°·Î ·Îº¿ÀÌ ¾îµð¿¡¼ ¿Ô´ÂÁö¸¦ ¾Ë¾Æ³½´Ù. IPÁÖ¼Ò´Â ¾îµð°í, DNSµµ¸ÞÀÎÀº
¾îµð°í, ¸¸¾à ±×°ÍµéÀÌ È°µ¿ÁßÀÎ ·Îº¿¸®½ºÆ® ¿¡
µé¾î ÀÖ´ÂÁö¸¦ Á¡°ËÇÑ´Ù. ¸¸¾à ÀÌ·± ½ÄÀ¸·Î »ó´ëÆí »çÀÌÆ®¸¦ ¾Ë¾Æ³¾ ¼ö ÀÖ´Ù¸é
Ã¥ÀÓÀÚ¿¡°Ô e-mailÀ» º¸³¾ ¼ö ÀÖÀ» °ÍÀÌ´Ù. µµ´ëü ¹«½¼ ÀÏÀÎÁö ¹°¾îº¸¶ó.
¾Æ´Ï¸é ±× »çÀÌÆ®ÀÇ ÀüȹøÈ£³ª ¸ÞÀÏ ¸Å´ÏÀú°°Àº »ç¶÷µé¿¡°Ô ¿¬¶ôÇغ¸¶ó.
±× ·Îº¿ÀÌ ¸®½ºÆ®¿¡ ¾øÀ¸¸é ¾òÀ» ¼ö ÀÖ´Â ¸ðµç Á¤º¸¸¦ ¸ð¾Æ¼ ÇÊÀÚ¿¡°Ô
¸ÞÀÏÀ» º¸³»ÁÖ¸é, ÇÊÀÚ´Â Àû¾îµµ ´Ù¸¥ »ç¶÷µé¿¡°Ô ÁÖÀǽÃų ¼ö´Â ÀÖ´Ù.
´ÙÀ½ ¼½¼ÇÀ» Àо¶ó.
·Îº¿ ¹èÁ¦ Ç¥ÁØ
¾Æ¸¶µµ ´ç½ÅÀÇ È£½ºÆ®°¡ ·Îº¿ ¹èÁ¦ Ç¥ÁØ¿¡¼
ÁöÁ¤ÇÑ ¹æ¹ý´ë·Î ¾î¶² ±ÔÄ¢À» Á¤Çسõ°í ÀÖ´ÂÁö ·Îº¿ÀÌ ¾Ë¾Æ³»·Á°í ÇÏ´Â
½ÃµµÀÌ´Ù. ¶ÇÇÑ ¾Æ·¡¸¦ ÂüÁ¶ÇÒ °Í.
¸¸¾à ·Îº¿µé¿¡ ´ëÇØ º°·Î °ü½ÉÀÌ ¾øÀ¸¸é ´ÜÁö robots.txt¶ó´Â ÆÄÀÏÀ»
´ç½Å ¼¹öÀÇ root·¹º§¿¡ ºñ¾îÀִ ä·Î ¸¸µé µÎ¶ó. ±×·¯¸é ¿¡·¯ ·Î±×ÆÄÀÏ¿¡
/robots.txt¸¦ ã´Ù°¡ ½ÇÆÐÇÑ ¿¡·¯¸Þ½ÃÁö¸¦ ¾ø¾Ù ¼ö ÀÖ´Ù.
/robots.txtÆÄÀÏ¿¡´Â "³Ê ´©±¸¾ß?"ÇÏ´Â ½ÄÀÇ ¸Þ½ÃÁö³ª, HTMLű׸¦
³ÖÁö´Â ¸»¶ó. ±× ÅؽºÆ® ÆÄÀÏÀº ·Îº¿ÀÌ Àд °ÍÀ̹ǷΠ¾Æ¸¶ ¾Æ¹«µµ
ÀÐÁö ¾ÊÀ» °ÍÀÌ´Ù.
°¡Àå ½¬¿î ¹æ¹ýÀº, ´ÙÀ½ÀÇ µÎÁÙÀ» /robots.txtÆÄÀÏ¿¡ ³Ö¾îµÎ´Â °ÍÀÌ´Ù.
User-agent: *
Disallow: /
ÇÏÁö¸¸ ±×°Íº¸´Ù´Â Á»´õ ¼±ÅÃÀûÀ¸·Î Áö½ÃÇÏ´Â °Íµµ ¾î·Á¿î ÀÏÀÌ ¾Æ´Ï´Ù.
Àüü ·Îº¿ ¹èÁ¦ Ç¥ÁØÀ» Àо ¼öµµ ÀÖÁö¸¸,
°³³äÀº ´Ü¼øÇÏ´Ù: °£´ÜÇÑ ±¸Á¶ÀûÀÎ ÆÄÀÏÀ» ¸¸µå´Â °ÍÀε¥, ±× ÆÄÀÏ¿¡´Â
´ç½ÅÀÇ ¼¹öÀÇ ¾î¶² ºÎºÐ¿¡ ´ëÇÑ Á¢±ÙÀ» ¾î¶»°Ô ·Îº¿µé ÀϺΠȤÀº Àüü¿¡°Ô
Çã¶ôÇϰųª ºÒÇãÇÏ´Â °ÍÀ» Áö½ÃÇÒ ¼ö ÀÖ´Ù. ¿¹¸¦ µé¸é...
# http://webcrawler.com/¿¡ ÀÖ´Â /robots.txt ÆÄÀÏÀÇ °æ¿ì
# °Ç¼³ÀûÀÎ ºñÆòÀ» ÁֽǷÁ¸é webmaster@webcrawler.com·Î ¸ÞÀÏÀ» Áֽʽÿä.
User-agent: webcrawler
Disallow:
User-agent: lycra
Disallow: /
User-agent: *
Disallow: /tmp
Disallow: /logs
óÀ½ µÎ¶óÀÎÀº '#'·Î ½ÃÀÛÇÏ´Â µ¥, À̰͵éÀº ÄÚ¸àÆ®À̹ǷΠ·Îº¿µéÀÌ
¹«½ÃÇÑ´Ù.
ù ¹®´Ü¿¡¼´Â webcrawler¶ó´Â ·Îº¿¿¡ ´ëÇØ ¾Æ¹«°Íµµ ºÒÇãÇÏÁö ¾Ê´Â´Ù´Â
°ÍÀ» ¾ê±âÇÑ´Ù. ´Ù½Ã¸»ÇØ ¾îµð¿¡³ª °¥ ¼ö ÀÖ´Ù°í Çã¶ôÇÏ´Â °ÍÀÌ´Ù.
µÎ¹ø° ¹®´Ü¿¡¼´Â lycra¶ó´Â ·Îº¿¿¡ ´ëÇØ, '/'¿¡ »ó´ëÀûÀ¸·Î ¾Æ·¡ ÀÖ´Â
¸ðµç URL¿¡ ´ëÇØ Á¢±ÙÀ» Á¦ÇÑÇÏ°Ú´Ù´Â ¶æÀÌ´Ù. ¸ðµç URLÀº '/'·ÎºÎÅÍ
½ÃÀ۵ǹǷΠÀÌ°ÍÀº ÀÌ ·Îº¿¿¡ ÀÌ »çÀÌÆ® Àüü¸¦ ºÒÇãÇÏ°Ú´Ù´Â ¶æÀÌ´Ù.
¼¼¹ø° ¹®´ÜÀº ¸ðµç ·Îº¿µé¿¡ ´ëÇØ /tmp³ª /logs·Î ½ÃÀÛÇÏ´Â URLÀ»
ÀоÁö ¸øÇϵµ·Ï ¸·´Â °ÍÀ» ¾ê±âÇÑ´Ù. ¿©±â¼ ÁÖÀÇÇÒ Á¡Àº '*'¶ó´Â
±ÛÀÚ°¡ ¾î¶² ÅäÅ«À̹ǷÎ, Regular ExpressionÀÇ *¿Í´Â ´Ù¸¥ ÀǹÌÀÌ´Ù.
ÈçÈ÷ ÀúÁö¸£´Â ¿¡·¯ µÎ°¡Áö¸¦ ÁöÀûÇϸé:
- Regular expressionÀº Áö¿øÇÏÁö _¾Ê´Â´Ù_.: µû¶ó¼ Disallow: /tmp/*´Â
Ʋ¸° °ÍÀÌ°í ±× ´ë½Å Disallow: /tmp¶ó°í ½á¾ß ÇÑ´Ù.
- ÇϳªÀÇ Disallow¶óÀο¡ µÎ°³ ÀÌ»ó ³ÖÁö ¸»¶ó. (ÀÌ°ÍÀº ´ÙÀ½ ¹öÁ¯¿¡¼´Â
¹Ù²ð ¼ö ÀÖ±â´Â ÇÏÁö¸¸ ÇöÁö´Â ÇÑÁÙ¿¡ Çϳª¸¸ ³Ö´Â °ÍÀÌ ¿øÄ¢ÀÌ´Ù.)
°ÅÀÇ... ¸î¸î ¾ÆÀ̵ð¾îµéÀÌ ¶°¿À¸£±â´Â ÇÏÁö¸¸, ±× ¾ÆÀ̵ð¾îµéÀ»
Àϸñ¿ä¿¬ÇÏ°Ô Ãæµ¹¾øÀÌ Á¤¸®ÇÏ¿© ¸¸µéÁö ¸øÇß´Ù. ½Ã°£ÀÌ ¾ø¾î¼...
¶ÇÇÑ ¾Ð·Âµµ Å©Áö ¾Ê¾Æ¼... Á¦¾ÈÀÌ ÀÖÀ¸¸é ¸ÞÀϸµ ¸®½ºÆ®·Î
¸ÞÀÏÀ» º¸³»Áֱ⠹ٶõ´Ù. ¶ÇÇÑ ·Îº¿ ȨÆäÀÌÁö¿¡ ÇöÀç ÁøÇàÁßÀÎ
ÀÏÀÌ ¹Ý¿µµÇ¹Ç·Î üũÇØÁֱ⠹ٶõ´Ù.
°¡¿ë¼º, ¾î¶² ·Îº¿À» ¾µ ÀÖ³ª?
·Îº¿À» »ç¿ëÇÑ´Ù´Â °ÍÀº ·Îº¿ÀÌ µ¿ÀÛÇÑ °á°ú¸¦ »ç¿ëÇÑ´Ù´Â ¶æÀ̶ó¸é,
´Ù¾çÇÑ °Ë»ö ¼ºñ½º³ª µð·ºÅ丮 ¼ºñ½º¸¦ º¼ ¼ö ÀÖÀ» °ÍÀÌ´Ù.
¿¹¸¦ µé¸é ³Ý½ºÄÉÀÌÇÁ»çÀÇ
Exploring the Web
ȤÀº ¸ÞŸ°Ë»ö ¼ºñ½º¸¦ ¿øÇϸé
MetaSearch¿¡¼ ·Îº¿ÀÌ ¸ð¾Æ³õÀº
ÀÚ·á·ÎºÎÅÍ °Ë»ö ¼ºñ½º°¡ ÀÌ·ïÁö°í ÀÖ´Ù.
¸®½ºÆ®¿¡¼ ·Îº¿ÀÇ ¸®½ºÆ®´Â º¼ ¼ö ÀÖÁö¸¸... ·Îº¿À» °ø°³ÇÏ´Â °ÍÀ»
Á» ´ÊÃ߶ó°í ÇÊÀÚ´Â ±ÇÇÏ°í ÀÖ´Ù.
±×µ¿¾È µÎ°³ÀÇ ·Îº¿ÀÌ °ø°³µÇ¾ú´Âµ¥, Harvest(°øÂ¥)¿Í VerityÀÇ ·Îº¿ÀÌ
±×°ÍÀÌ´Ù.
À§ÀÇ ³»¿ëÀ» ÂüÁ¶ -- ´©±º°¡´Â ·Îº¿À» Á¦°øÇÒ Àǻ簡 ÀÖÀ» Áöµµ ¸ð¸¥´Ù.
¸Å¿ì ¸¹´Ù. ¸ÕÀú
·Îº¿ ÆäÀÌÁö¸¦ Àо°í, ±×¸®°í ³ª¼ WWW ConferenceÀÇ ÇÁ·Î½ÃµùµéÀ»
Àо¶ó. ±×¸®°í ³ª¼ HTTP, HTMLÀÇ Ç¥ÁØÀ» »ìÆ캸¶ó. ¹°·Ð ¹«Ã´ ¸¹Àº
ÀÏÀÓ¿¡´Â Ʋ¸²¾ø´Ù.
°£´ÜÇÏ´Ù.
·Îº¿ µî·Ï ¼½Ä
À» ä¿ö¼ º¸³»ÁÖ¸é µÈ´Ù.
³¡: À¥ ·Îº¿¿¡ ´ëÇÑ Áú¹® ¹× ´ë´ä(FAQ)
[Homepage]
Contact to Micky...