검색 엔진 캐시

Search engine cache
검색에서 캐시된 웹 페이지의 버전에 대한 링크는 Google(위), Bing(중) 및 Yandex(아래)의 결과입니다.

검색 엔진 캐시는 웹 크롤러에 의해 인덱싱되었을 때 페이지를 그대로 보여주는 웹 페이지의 캐시입니다. 캐시된 웹 페이지 버전은 실시간 버전에 연결할 수 없거나 변경되거나 삭제되었을 때 페이지 내용을 보는 데 사용할 수 있습니다.[1]

웹 크롤러는 웹 페이지의 내용을 수집한 다음 웹 검색 엔진에 의해 인덱싱됩니다. 검색 엔진은 사용자가 복사본에 액세스할 수 있도록 할 수 있습니다. 로봇의 제한을 준수하는 웹 크롤러입니다.사이트 웹마스터에 의한 txt[2] 메타태그[3] 캐시된 복사본을 검색 엔진 사용자가 사용하지 않도록 지시할 경우 사용할 수 없게 할 수 있습니다.

검색 엔진 캐시는 범죄 수사,[4] 법적 절차[5]저널리즘에 사용할 수 있습니다.[6][1] 사용자에게 캐시된 웹 페이지 버전을 제공하는 검색 엔진의 예로는 Bing, Yandex SearchBaidu가 있습니다.

검색 엔진 캐시는 저작권 침해 주장으로부터 기술 제공자를 보호하는 일반적인 법률에 의해 완전히 보호되지 않을 수 있습니다.[7]

구글, 2024년 웹 캐싱 서비스 폐지 이 서비스는 구글 검색 결과에 나타날 수 있지만 일시적으로 오프라인 상태인 웹 사이트를 위해 설계되었습니다. 장기 보관 또는 중기 보관 목적으로 설계되지 않았습니다. Google은 2024년 현재 인터넷이 이전의 "이전"보다 훨씬 더 안정적이며 따라서 캐시 서비스는 더 이상 유지해야 할 중요한 서비스가 아니라고 말했습니다. 구글은 웨이백 머신을 더 나은 대안으로 지목했고, 구글이 미래에 그들과 함께 일할 수도 있다고 제안했습니다.[8]


참고문헌

  1. ^ a b Wilfried Ruetten (2012). The Data Journalism Handbook. O'Reilly Media, Inc. ISBN 9781449330064. When a page becomes controversial, the publishers may take it down or alter it without acknowledgment. If you suspect you're running into the problem, the first place to turn is Google's cache of the page as it was when it did its last crawl.
  2. ^ "Robots meta tag, data-nosnippet, and X-Robots-Tag specifications". noarchive: Do not show a cached link in search results.
  3. ^ "Special tags that Google understands - Search Console Help". noarchive - Don't show a Cached link for a page in search results.
  4. ^ Todd G. Shipley, Art Bowker (2013). Investigating Internet Crimes: An Introduction to Solving Crimes in Cyberspace. Newnes. ISBN 9780124079298. For the investigator this can be a valuable piece of information. Depending on when Google crawled the site, the last page may contain information different from the current page. Documenting and capturing Google's cached page of a webpage can therefore be important step to ensure this time snapshot is preserved.
  5. ^ Steven Mark Levy (2011). Regulation of Securities: SEC Answer Book. Aspen Publishers Online. ISBN 9781454805434. The World Wide Web is not as ephemeral as one might think. An increasing number of older web pages are available online through such services as the Wayback Machine, Yahoo Cache, or Bing Cache. Some plaintiffs' lawyers and corporate gadflies use these services as a matter of routine.
  6. ^ Cleland Thom (2014-10-23). "Google's caches and .com search engine provide 'right to be forgotten' solutions". Press Gazette. Journalists can also access delisted content via the Google cache.
  7. ^ Herman De Bauw, Valerie Vandenweghe (June 2011). "Brussels Court of Appeal upholds judgment against Google News and Google Cache". Archived from the original on 2015-04-26. For the cache function, the Court rejected the exception of a "technically necessary copy". This exception exempts temporary reproduction which is a necessary part of a technical process applied by an intermediary for transmission in a network between third parties. According to the Court, the cache copy that Google stores on its server is not technically necessary for efficient transmission.
  8. ^ "Google Search's cache links are officially being retired". 2 February 2024.