ওয়েব্যাক মেশিন
ওয়েব্যাক মেশিন হলো ওয়ার্ল্ড ওয়াইড ওয়েব-এর একটি ডিজিটাল সংরক্ষণাগার, যা ইন্টারনেট আর্কাইভ নামের একটি আমেরিকান অলাভজনক সংস্থা কর্তৃক প্রতিষ্ঠিত হয়েছে এবং যার সদর দপ্তর সান ফ্রান্সিস্কো, ক্যালিফোর্নিয়াতে। ২০০১ সালে সর্বসাধারণের জন্য উন্মুক্ত করা হয়; এই সেবার মাধ্যমে ব্যবহারকারীরা "সময়ে ফিরে" গিয়ে পুরনো ওয়েবসাইট কীভাবে দেখাতো, তা দেখতে পারেন। প্রতিষ্ঠাতা ব্রুস্টার কাহল ও ব্রুস গিলিয়াট ওয়েব্যাক মেশিন তৈরি করেন "সর্বজনীন জ্ঞানে প্রবেশাধিকার" নিশ্চিত করার লক্ষ্যে, যাতে বন্ধ হয়ে যাওয়া ওয়েবপেজ সংরক্ষণ করা যায়।[৪]
![]() | |
স্ক্রিনশট | |
সাইটের প্রকার | Archive |
---|---|
মালিক | ইন্টারনেট আর্কাইভ |
ওয়েবসাইট | web |
অ্যালেক্সা অবস্থান | 249 (as of November 2017)[১] |
নিবন্ধন | Optional |
চালুর তারিখ | ২৪ অক্টোবর ২০০১[২][৩] |
বর্তমান অবস্থা | Active |
প্রোগ্রামিং ভাষা | C, Perl |
ওয়েব্যাক মেশিনের প্রাচীনতম সংরক্ষণ ১৯৯৫ সাল পর্যন্ত গিয়ে পৌঁছে, এবং ২০০৯ সালের শেষ নাগাদ ৩৮.২ বিলিয়নের বেশি ওয়েবপেজ সংরক্ষিত হয়। নভেম্বর ২০২৪ অনুযায়ী, ওয়েব্যাক মেশিন ৯১৬ বিলিয়নের বেশি ওয়েবপেজ এবং ১০০-এর বেশি পেটাবাইট তথ্য সংরক্ষণ করেছে।[৫][৬]
ইতিহাস
সম্পাদনাক্যাশড ওয়েব পেজ সংরক্ষণের কাজ ইন্টারনেট আর্কাইভ অন্তত ১৯৯৫ সাল থেকে করে আসছে। সংরক্ষিত প্রাচীনতম ওয়েব পেজগুলোর একটি আর্কাইভ করা হয় ১৯৯৫ সালের ৮ মে।[৭]
ইন্টারনেট আর্কাইভের প্রতিষ্ঠাতা ব্রুস্টার কাহল ও ব্রুস গিলিয়াট সান ফ্রান্সিসকো, ক্যালিফোর্নিয়া-তে[৮] ২০০১ সালের অক্টোবর মাসে ওয়েব্যাক মেশিন চালু করেন,[৯][১০] মূলত ওয়েব কনটেন্ট হারিয়ে যাওয়ার সমস্যা সমাধানের উদ্দেশ্যে; অর্থাৎ যখন কোনো ওয়েবসাইট পরিবর্তিত হয় বা বন্ধ হয়ে যায়, তখন সেই কনটেন্ট হারিয়ে যেতে না পারে।[১১] এই পরিষেবা ব্যবহারকারীদের বিভিন্ন সময়ে সংরক্ষিত ওয়েব পেজ দেখার সুযোগ দেয়, যাকে আর্কাইভ "তিন-মাত্রিক সূচি" হিসেবে উল্লেখ করে।[১২] কাহল ও গিলিয়াট এই মেশিন তৈরি করেন পুরো ইন্টারনেট সংরক্ষণ এবং "সর্বজনীন জ্ঞানপ্রাপ্তির সুযোগ" নিশ্চিত করার লক্ষ্য নিয়ে।[১৩] "ওয়েব্যাক মেশিন" নামটি ১৯৬০-এর দশকের অ্যানিমেটেড কার্টুন দ্য অ্যাডভেঞ্চার্স অব রকি অ্যান্ড বুলউইঙ্কল অ্যান্ড ফ্রেন্ডস-এর একটি কল্পিত টাইম-ট্রাভেল ডিভাইস থেকে নেওয়া হয়েছে।[১৪][১৫][১৬] কার্টুনের "পিবডির ইমপ্রোবেবল হিস্ট্রি" অংশে মিস্টার পিবডি ও শারম্যান "ওয়েব্যাক মেশিন" ব্যবহার করে অতীতে ফিরে গিয়ে বিখ্যাত ঐতিহাসিক ঘটনাগুলো প্রত্যক্ষ ও অংশগ্রহণ করেন।[১৭]
১৯৯৬ থেকে ২০০১ সাল পর্যন্ত তথ্য ডিজিটাল টেপে সংরক্ষিত ছিল, এবং মাঝে মাঝে কাহল গবেষক ও বিজ্ঞানীদের সেই "ভারি-চালিত" ডাটাবেস ব্যবহারের সুযোগ দিতেন।[১৮] ২০০১ সালে আর্কাইভের পঞ্চম বার্ষিকীতে, ক্যালিফোর্নিয়া বিশ্ববিদ্যালয়, বার্কলি-তে এক অনুষ্ঠানের মাধ্যমে এটি সর্বসাধারণের জন্য উন্মুক্ত করা হয়।[১৯] ওয়েব্যাক মেশিন চালুর সময়ই সেখানে ১০ বিলিয়নের বেশি পেজ সংরক্ষিত ছিল।[২০] এই ডেটা ইন্টারনেট আর্কাইভের বিশাল লিনাক্স ক্লাস্টারে সংরক্ষণ করা হয়।[১৩] এটি নতুন ওয়েবসাইট নিয়মিত সংরক্ষণ ও হালনাগাদ করে (নীচে প্রযুক্তিগত বিবরণ দেখুন)।[২১] এছাড়াও, ব্যবহারকারীরা ওয়েবসাইটের URL ইনপুট করেও নিজে থেকে ওয়েবসাইট সংরক্ষণ করতে পারেন, যদি ওয়েবসাইটটি ওয়েব্যাক মেশিনের ক্রল করার অনুমতি দেয়।[২২]
৩০ অক্টোবর ২০২০ থেকে ওয়েব্যাক মেশিন বিষয়বস্তুর সত্যতা যাচাইয়ের কাজ শুরু করে।[২৩] ২০২২ সালের জানুয়ারি থেকে, অ্যাড সার্ভার ডোমেইনগুলো সংরক্ষণ থেকে নিষ্ক্রিয় রাখা হয়েছে।[২৪]
মে ২০২১-এ, ইন্টারনেট আর্কাইভের ২৫ বছর পূর্তিতে, ওয়েব্যাক মেশিন "ওয়েবফরোয়ার্ড মেশিন" চালু করে, যা ব্যবহারকারীদের "২০৪৬ সালের ইন্টারনেট"—যেখানে জ্ঞান অবরোধের মুখে—পর্যটনের সুযোগ দেয়।[২৫][২৬]
প্রযুক্তিগত তথ্য
সম্পাদনাওয়েব্যাক মেশিনের সফটওয়্যার তৈরি হয়েছে ওয়েব "ক্রল" করার জন্য, যাতে ওয়েবপেজ, গোফার হায়ারার্কি, নেটনিউজ (ইউজনেট) বুলেটিন বোর্ড সিস্টেম ও সফটওয়্যারের সব পাবলিক তথ্য ও ডেটা ফাইল ডাউনলোড করা যায়।[২৭] তবে এসব 'ক্রলার'-এর সংগ্রহে ইন্টারনেটের সব তথ্য আসে না, কারণ অনেক ডেটা প্রকাশক কর্তৃক সীমাবদ্ধ বা ডাটাবেসে সংরক্ষিত থাকে, যা উন্মুক্ত নয়। আংশিক ক্যাশকৃত ওয়েবসাইটের অসামঞ্জস্য দূর করতে, ২০০৫ সালে ইন্টারনেট আর্কাইভ "Archive-It.org" চালু করে, যাতে প্রতিষ্ঠান ও কনটেন্ট নির্মাতারা স্বেচ্ছায় ডিজিটাল কনটেন্ট সংগ্রহ ও সংরক্ষণ করতে পারেন এবং নিজস্ব ডিজিটাল সংরক্ষণাগার গড়ে তুলতে পারেন।[২৮]
বিভিন্ন উৎস থেকে ক্রল করা হয়, কিছু তৃতীয় পক্ষ থেকে আমদানি এবং কিছু ইন্টারনাল ক্রল।[২১] যেমন, স্লোন ফাউন্ডেশন ও আলেক্সা থেকে সংগৃহীত ক্রল, NARA এবং ইন্টারনেট মেমোরি ফাউন্ডেশন-এর জন্য ইন্টারনেট আর্কাইভ কর্তৃক চালিত ক্রল, আর্কাইভ টিম-এর আর্কাইভ করা ওয়েবপেজ,[২৯] ও কমন ক্রল-এর মিরর অন্তর্ভুক্ত আছে।[২১] "ওয়ার্ল্ডওয়াইড ওয়েব ক্রল" ২০১০ সাল থেকে চলে আসছে এবং বৈশ্বিক ওয়েব সংগ্রহ করে।[২১][৩০] ২০২০ সালের সেপ্টেম্বরে ইন্টারনেট আর্কাইভ ক্লাউডফ্লেয়ার-এর সাথে অংশীদারিত্ব ঘোষণা করে, যাতে তার "Always Online" সার্ভিসের ওয়েবসাইটগুলো স্বয়ংক্রিয়ভাবে সংরক্ষণ করা যায়।[৩১]
নথি ও রিসোর্সসমূহ ২০২৫০৮৩০২০১৪৫০
টাইমস্ট্যাম্প URL-এ সংরক্ষিত হয়। প্রতিটি পেজের ছবি, স্টাইলশিট, স্ক্রিপ্টসহ আলাদা রিসোর্সের টাইমস্ট্যাম্প লিঙ্ক যুক্ত থাকে, যাতে একই সময়ের কাছাকাছি সংরক্ষিত ভার্সনে স্বয়ংক্রিয়ভাবে রিডাইরেক্ট হয়।[৩২]
ওয়েবসাইট অনুযায়ী সংরক্ষণের ফ্রিকোয়েন্সি ভিন্ন হয়।[২১] "ওয়ার্ল্ডওয়াইড ওয়েব ক্রল"-এর ওয়েবসাইটগুলো "ক্রল লিস্ট"-এ যুক্ত থাকে, প্রতিবার ক্রলের সময় একটি করে সংরক্ষণ করা হয়।[২১] একেকটি ক্রল সম্পূর্ণ হতে মাস বা বছরেরও বেশি লাগতে পারে, সাইজের ওপর নির্ভর করে।[২১] উদাহরণস্বরূপ, "ওয়াইড ক্রল নাম্বার ১৩" শুরু হয়েছিল ৯ জানুয়ারি ২০১৫, শেষ হয় ১১ জুলাই ২০১৬।[৩৩] তবে একই সময়ে একাধিক ক্রল চলতে পারে, ওয়েবসাইট একাধিক ক্রল লিস্টে থাকতে পারে, তাই কত ঘন ঘন কোন সাইট ক্রল হয়, তা পরিবর্তনশীল।[২১]
২০১৩ সালের অক্টোবর মাসে "সেভ পেজ নাউ" ফিচার চালু হয়,[৩৪] যা ওয়েবব্যাক মেশিনের মূল পাতার নিচের ডান পাশে পাওয়া যায়।[৩৫] নির্দিষ্ট URL দিয়ে পেজ সংরক্ষণ করা হলে তা ওয়েবব্যাক মেশিনের অংশ হয়ে যায়।[৩৪] web.archive.org ঠিকানা ব্যবহার করে ব্যবহারকারীরা PDF ও ডেটা কম্প্রেশন ফরম্যাটসহ বিভিন্ন ধরনের কনটেন্ট আপলোড করতে পারেন। ওয়েবব্যাক মেশিন আপলোড করা কনটেন্টের স্থায়ী স্থানীয় URL তৈরি করে, যা ওয়েবে প্রবেশযোগ্য, এমনকি https://archive.org অফিশিয়াল সাইটে অনুসন্ধানে না পাওয়া গেলেও।টেমপ্লেট:Jargon inline
২০১৯ সালের অক্টোবর থেকে ব্যবহারকারীদের আর্কাইভাল অনুরোধ ও রিট্রিভ প্রতি মিনিটে ১৫-তে সীমাবদ্ধ করা হয়েছে।[৩৬]
সংরক্ষণ ক্ষমতা ও বৃদ্ধি
সম্পাদনাবছর ধরে প্রযুক্তি উন্নয়নের সাথে সাথে ওয়েবব্যাক মেশিনের সংরক্ষণ ক্ষমতা বেড়েছে। ২০০৩ সালে, সর্বসাধারণের জন্য উন্মুক্ত হওয়ার দুই বছর পর, এটি প্রতি মাসে ১২ টেরাবাইট হারে বাড়ছিল। ডেটা সংরক্ষণ করা হয় পেটাবক্স র্যাক সিস্টেমে, যা ইন্টারনেট আর্কাইভ কর্মীরা কাস্টম ডিজাইন করেন। প্রথম ১০০ টেরাবাইট র্যাক ২০০৪ সালের জুনে চালু হয়, তবে পরে আরও বেশি স্টোরেজের দরকার হয়।[৩৭][৩৮]
২০০৯ সালে ইন্টারনেট আর্কাইভ তাদের কাস্টম স্টোরেজ আর্কিটেকচার সান ওপেন স্টোরেজ-এ স্থানান্তর করে, এবং সান মডুলার ডেটাসেন্টার-এ নতুন ডেটা সেন্টার স্থাপন করে, সান মাইক্রোসিস্টেমস-এর ক্যালিফোর্নিয়া ক্যাম্পাসে।[৩৯] ২০০৯-এর হিসাব অনুযায়ী[হালনাগাদ], ওয়েবব্যাক মেশিনে আনুমানিক তিন পেটাবাইট ডেটা ছিল এবং প্রতি মাসে ১০০ টেরাবাইট হারে বাড়ছিল।[৪০]
২০১১ সালে নতুন ইন্টারফেস ও ফ্রেশার ইনডেক্সসহ ওয়েবব্যাক মেশিনের একটি নতুন ভার্সন উন্মুক্ত করা হয়, যেখানে ক্যালেন্ডার বিন্যাসে সংরক্ষণের তারিখ ও সংরক্ষণ সংখ্যার ভিজ্যুয়ালাইজেশন যুক্ত ছিল। টুলবার ও বার চার্ট, "Changes", "Summary", ও গ্রাফিক্যাল সাইট ম্যাপ ফিচার যোগ করা হয়। ২০১১ সালেই ষষ্ঠ জোড়া পেটাবক্স র্যাক সংযোজন করা হয়, যা সংরক্ষণক্ষমতা ৭০০ টেরাবাইট বাড়ায়।[৪১]
২০১৩ সালের জানুয়ারিতে ২৪০ বিলিয়ন URL সংরক্ষণের মাইলফলক অতিক্রম করে।[৪২]
২০১৩ সালের অক্টোবর মাসে "Save a Page" ফিচার যুক্ত হয়, যাতে যে কেউ একটি URL সংরক্ষণ করতে পারেন এবং একটি স্থায়ী লিংক পেয়ে যান।[৪৩][৪৪]
২০১৪ সালের ডিসেম্বর মাসে ওয়েবব্যাক মেশিনে ৪৩৫ বিলিয়ন ওয়েবপেজ—প্রায় ৯ পেটাবাইট তথ্য ছিল, এবং প্রতি সপ্তাহে প্রায় ২০ টেরাবাইট করে বাড়ছিল।[২০] ... (এ অংশের আরও বিস্তারিত চাইলে জানাবেন।)
ওয়েব্যাক মেশিন এপিআই
সম্পাদনাওয়েব্যাক মেশিন সেবা তিনটি পাবলিক এপিআই প্রদান করে—SavePageNow, Availability এবং CDX।[৪৫] SavePageNow ব্যবহার করে ওয়েব পেজ সংরক্ষণ করা যায়। Availability API-র মাধ্যমে কোনো ওয়েব পেজ সংরক্ষিত আছে কিনা বা আর্কাইভে পাওয়া যাবে কিনা তা পরীক্ষা করা হয়,[৪৬] অর্থাৎ সংশ্লিষ্ট ওয়েব পেজের আর্কাইভ আছে কিনা জানা যায়। CDX API ব্যবহার হয় আরও জটিল অনুসন্ধান, ফিল্টারিং এবং সংরক্ষিত তথ্য বিশ্লেষণের জন্য।[৪৭][৪৮]
ওয়েবসাইট বর্জন নীতি
সম্পাদনাঐতিহাসিকভাবে, ওয়েব্যাক মেশিন রোবটস এক্সক্লুশন স্ট্যান্ডার্ড (robots.txt) অনুসরণ করত, যাতে নির্ধারণ করা হতো কোনো ওয়েবসাইট ক্রল বা সংরক্ষণ করা হবে কিনা—অথবা ইতিমধ্যে সংরক্ষিত হয়ে থাকলে, সেই আর্কাইভ সর্বজনীনভাবে দেখানো হবে কিনা। ওয়েবসাইটের মালিকেরা robots.txt ব্যবহার করে ওয়েব্যাক মেশিন থেকে নিজ সাইটের তথ্য বর্জন করতে পারতেন। এছাড়া robots.txt নীতি পূর্ববর্তী সংরক্ষণেও প্রয়োগ করা হতো; কোনো সাইট ইন্টারনেট আর্কাইভ ব্লক করলে, সংশ্লিষ্ট ডোমেইনের আগে সংরক্ষিত পেজগুলোও তাৎক্ষণিকভাবে দেখা যেত না। পাশাপাশি, ইন্টারনেট আর্কাইভ জানিয়েছে, "কখনো কখনো, ওয়েবসাইটের মালিক সরাসরি আমাদের সাথে যোগাযোগ করেন এবং ক্রলিং বা সংরক্ষণ বন্ধের অনুরোধ করেন। আমরা এসব অনুরোধ মেনে চলি।"[৪৯] এছাড়া ওয়েবসাইটটিতে আরও বলা হয়েছে: "ইন্টারনেট আর্কাইভ এমন কোনো ওয়েবসাইট বা ইন্টারনেট ডকুমেন্ট সংরক্ষণ বা প্রদর্শনে আগ্রহী নয়, যেগুলোর মালিক তাদের তথ্য আমাদের সংগ্রহে রাখতে চান না।"[৫০][৫১]
১৭ এপ্রিল ২০১৭-এ জানা যায়, বহু অকার্যকর ওয়েবসাইট এবং পার্কড ডোমেইন robots.txt ব্যবহার করে নিজেদের সার্চ ইঞ্জিন থেকে বর্জন করছিল, ফলে এসব সাইট অনিচ্ছাকৃতভাবে ওয়েব্যাক মেশিন থেকেও বাদ পড়ছিল।[৫২] এরপর ইন্টারনেট আর্কাইভ নীতি পরিবর্তন করে—এখন কেবল স্পষ্টভাবে বাদ দেওয়ার অনুরোধ পেলে সাইট ওয়েব্যাক মেশিন থেকে অপসারণ করা হয়।[৩২]
দ্য ওকল্যান্ড আর্কাইভ নীতি
সম্পাদনাওয়েব্যাক-এর এই পূর্বপ্রযোজ্য বর্জন নীতি আংশিকভাবে Recommendations for Managing Removal Requests and Preserving Archival Integrity (সংক্ষেপে The Oakland Archive Policy) দ্বারা প্রভাবিত, যা ২০০২ সালে ক্যালিফোর্নিয়া বিশ্ববিদ্যালয়, বার্কলের School of Information Management and Systems থেকে প্রকাশিত হয়েছিল, এবং এতে ওয়েবসাইটের মালিককে নিজের সাইটের সংরক্ষিত তথ্য দেখাতে বা লুকাতে অধিকার দেওয়া হয়েছে।[৫৩] ব্যয়বহুল মামলা এড়াতে ওয়েব্যাক এই নীতিতে চলেছে।[৫৪]
২০১৭ সালে এই নীতিতে শিথিলতা আসে—তখন থেকে ওয়েবব্যাক যুক্তরাষ্ট্রের সরকারি ও সামরিক ওয়েবসাইটে robots.txt আর মান্য করছে না, উভয় ক্ষেত্রেই (ক্রল ও প্রদর্শন)। এপ্রিল ২০১৭-র পর থেকে, ওয়েবব্যাক আরও বিস্তৃতভাবে robots.txt উপেক্ষা করছে, শুধু মার্কিন সরকারি সাইট নয়।[৫৫][৫৬][৫৭][৫৮]
ব্যবহার
সম্পাদনা২০০১ সালে সর্বসাধারণের জন্য চালু হওয়ার পর থেকে, ওয়েব্যাক মেশিন—এর তথ্য সংরক্ষণ ও সংগ্রহ পদ্ধতি এবং এতে সংরক্ষিত পৃষ্ঠাসমূহ নিয়ে গবেষকরা নানা গবেষণা চালিয়েছেন। ২০১৩ সাল নাগাদ, তথ্যপ্রযুক্তি, গ্রন্থাগার ও তথ্যবিজ্ঞান, এবং সমাজবিজ্ঞান-সহ বিভিন্ন ক্ষেত্রে ওয়েব্যাক মেশিন নিয়ে প্রায় ৩৫০টি প্রবন্ধ প্রকাশিত হয়েছে। সমাজবিজ্ঞানীরা ওয়েব্যাক মেশিন ব্যবহার করে ১৯৯০-এর দশকের মাঝামাঝি থেকে ওয়েবসাইটের বিকাশ কীভাবে প্রতিষ্ঠানগুলোর অগ্রগতিতে প্রভাব ফেলেছে, তা বিশ্লেষণ করেছেন।[২০]
ওয়েব্যাক মেশিন কোনো ওয়েব পেজ সংরক্ষণ করলে সাধারণত অধিকাংশ হাইপারলিঙ্কসহ সংরক্ষণ করে, ফলে ওই লিঙ্কগুলো সচল থাকে—যা ইন্টারনেটের অস্থিরতায় সহজেই ভেঙে যেতে পারত। ভারতে করা এক গবেষণায় দেখা যায়, অনলাইন একাডেমিক প্রকাশনায় ব্যবহৃত লিঙ্ক সংরক্ষণে ওয়েব্যাক মেশিন অর্ধেকের কিছু বেশি সংরক্ষণ করতে পেরেছে।[৫৯]
"সাংবাদিকরা ওয়েব্যাক মেশিন ব্যবহার করেন অকার্যকর ওয়েবসাইট, পুরনো সংবাদ প্রতিবেদন এবং ওয়েবসাইটের কনটেন্ট পরিবর্তনের নজরদারিতে। রাজনীতিবিদদের জবাবদিহি এবং যুদ্ধক্ষেত্রের মিথ্যা উদ্ঘাটনেও এর সংরক্ষিত তথ্য ব্যবহৃত হয়েছে।"[৬০] ২০১৪ সালে, ইউক্রেনের বিচ্ছিন্নতাবাদী নেতা ইগর গিরকিন-এর সংরক্ষিত এক সামাজিক যোগাযোগ মাধ্যমের পাতায় দেখা যায়, তিনি তার বাহিনীর ইউক্রেনীয় সামরিক বিমান ভেবে একটি উড়োজাহাজ ভূপাতিত করার কথা লিখেছিলেন। পরে জানা যায়, সেটি আসলে মালয়েশিয়ান এয়ারলাইন্সের একটি যাত্রীবাহী বিমান (মালয়েশিয়া এয়ারলাইন্স ফ্লাইট ১৭) ছিল। এরপর তিনি পোস্টটি মুছে ফেলে দোষ ইউক্রেনীয় সেনাবাহিনীর ওপর চাপান।[৬০][৬১]
২০১৭ সালে, March for Science আন্দোলনের সূত্রপাত Reddit-এ এক আলোচনায়, যেখানে একজন ব্যবহারকারী Archive.org-এ গিয়ে দেখতে পান, হোয়াইট হাউজ ওয়েবসাইট থেকে জলবায়ু পরিবর্তন সম্পর্কিত সব রেফারেন্স মুছে ফেলা হয়েছে। এর প্রতিক্রিয়ায়, আরেকজন মন্তব্য করেন, "বিজ্ঞানীদের ওয়াশিংটনে মিছিল করা উচিত।"[৬২][৬৩][৬৪]
এই ওয়েবসাইটটি তথ্য যাচাই, রেফারেন্স সংগ্রহ এবং উইকিপিডিয়া সম্পাদকদের কনটেন্ট তৈরিতে ব্যাপকভাবে ব্যবহৃত হয়।[৬৫] নতুন ইউআরএল উইকিপিডিয়ায় যোগ হলে, ইন্টারনেট আর্কাইভ তা সংরক্ষণ করে থাকে।[৬৫]
২০২০ সালের সেপ্টেম্বর মাসে, ক্লাউডফ্লেয়ার-এর সঙ্গে অংশীদারিত্বের ঘোষণা আসে—তাদের "Always Online" সেবার মাধ্যমে স্বয়ংক্রিয়ভাবে ওয়েবসাইট সংরক্ষণ এবং মূল সাইট অনুপলব্ধ হলে ব্যবহারকারীদের সংরক্ষিত সংস্করণ দেখানোর সুবিধা যুক্ত হয়।[৩১]
আরও দেখুন
সম্পাদনাতথ্যসূত্র
সম্পাদনা- ↑ "Archive.org Site Info"। Alexa Internet। ১৮ জুন ২০১৬ তারিখে মূল থেকে আর্কাইভকৃত। সংগ্রহের তারিখ ১৮ জুন ২০১৬।
- ↑ "WayBackMachine.org WHOIS, DNS, & Domain Info – DomainTools"। WHOIS। ১৪ মে ২০২০ তারিখে মূল থেকে আর্কাইভকৃত। সংগ্রহের তারিখ ১৩ মার্চ ২০১৬।
- ↑ "InternetArchive.org WHOIS, DNS, & Domain Info – DomainTools"। WHOIS। ১২ মে ২০২০ তারিখে মূল থেকে আর্কাইভকৃত। সংগ্রহের তারিখ ১৩ মার্চ ২০১৬।
- ↑ Kahle, Brewster (২৩ নভেম্বর ২০০৫)। "Universal Access to all Knowledge"। ইন্টারনেট আর্কাইভ। ১৪ আগস্ট ২০২২ তারিখে মূল থেকে আর্কাইভকৃত। সংগ্রহের তারিখ ৫ জুন ২০২২।
- ↑ "Internet Archive: Wayback Machine"। web.archive.org। ১৩ মার্চ ২০২৩ তারিখে মূল থেকে আর্কাইভকৃত। সংরক্ষিত পেজের সর্বশেষ সংখ্যা আর্কাইভের মূল পাতায় দেখা যাবে।
- ↑ Kahle, Brewster। "A Message from Internet Archive Founder, Brewster Kahle"। Internet Archive। সংগ্রহের তারিখ ১০ জানুয়ারি ২০২৪।
- ↑ "ওয়েব্যাক মেশিনে সংরক্ষিত "ইউজিন পাবলিক লাইব্রেরি আওয়ার্স" পৃষ্ঠার স্ন্যাপশট, ইউজিন, ওরেগন পাবলিক লাইব্রেরি"। ওয়েব্যাক মেশিন। ইন্টারনেট আর্কাইভ। ৮ মে ১৯৯৫। ৮ মে ১৯৯৫ তারিখে মূল থেকে আর্কাইভকৃত।
- ↑ "Wayback Machine General Information"। Internet Archive। ৫ ডিসেম্বর ২০১৯ তারিখে মূল থেকে আর্কাইভকৃত। সংগ্রহের তারিখ ২ মার্চ ২০২১।
- ↑ "WayBackMachine.org WHOIS, DNS, & Domain Info – DomainTools"। WHOIS। ১৪ মে ২০২০ তারিখে মূল থেকে আর্কাইভকৃত। সংগ্রহের তারিখ ১৩ মার্চ ২০১৬।
- ↑ "InternetArchive.org WHOIS, DNS, & Domain Info – DomainTools"। WHOIS। ১২ মে ২০২০ তারিখে মূল থেকে আর্কাইভকৃত। সংগ্রহের তারিখ ১৩ মার্চ ২০১৬।
- ↑ Notess, Greg R. (মার্চ–এপ্রিল ২০০২)। "The Wayback Machine: The Web's Archive"। Online। ২৬: ৫৯–৬১। টেমপ্লেট:INIST।
- ↑ "The Wayback Machine", Frequently Asked Questions, ১৮ সেপ্টেম্বর ২০১৮ তারিখে মূল থেকে আর্কাইভকৃত, সংগ্রহের তারিখ ১৮ সেপ্টেম্বর ২০১৮
- ↑ ক খ "20,000 Hard Drives on a Mission"। Internet Archive Blogs। ২৫ অক্টোবর ২০১৬। ২০ অক্টোবর ২০১৮ তারিখে মূল থেকে আর্কাইভকৃত। সংগ্রহের তারিখ ১৫ অক্টোবর ২০১৮।
- ↑ Green, Heather (২৮ ফেব্রুয়ারি ২০০২)। "A Library as Big as the World"। BusinessWeek। ২০ ডিসেম্বর ২০১১ তারিখে মূল থেকে আর্কাইভকৃত।
- ↑ Tong, Judy (৮ সেপ্টেম্বর ২০০২)। "Responsible Party – Brewster Kahle; A Library Of the Web, On the Web"। দ্য নিউ ইয়র্ক টাইমস। ২০ ফেব্রুয়ারি ২০১১ তারিখে মূল থেকে আর্কাইভকৃত। সংগ্রহের তারিখ ১৫ আগস্ট ২০১১।
- ↑ কিথ স্কট (২০০০)। The Moose that Roared: The Story of Jay Ward, Bill Scott, a Flying Squirrel, and a Talking Moose। সেন্ট মার্টিন্স প্রেস। আইএসবিএন ০-৩১২-১৯৯২২-৮
- ↑ Markstein, Don। "Toonopedia: "Peabody's Improbable History""। Toonpedia.com। সংগ্রহের তারিখ ৭ নভেম্বর ২০২৪।
- ↑ Cook, John (১ নভেম্বর ২০০১)। "Web site takes you way back in Internet history"। Seattle Post-Intelligencer। ১২ আগস্ট ২০১৪ তারিখে মূল থেকে আর্কাইভকৃত। সংগ্রহের তারিখ ১৫ আগস্ট ২০১১।
- ↑ Mayfield, Kendra (২৮ অক্টোবর ২০০১)। "Wayback Goes Way Back on Web"। Wired। ১৬ অক্টোবর ২০১৭ তারিখে মূল থেকে আর্কাইভকৃত। সংগ্রহের তারিখ ১৬ অক্টোবর ২০১৭।
- ↑ ক খ গ Arora, Sanjay K.; Li, Yin; Youtie, Jan; Shapira, Philip (৫ মে ২০১৫)। "Using the wayback machine to mine websites in the social sciences: A methodological resource"। Journal of the Association for Information Science and Technology। ৬৭ (8): ১৯০৪–১৯১৫। ডিওআই:10.1002/asi.23503। এইচডিএল:10.1002/asi.23503। আইএসএসএন 2330-1635।
- ↑ ক খ গ ঘ ঙ চ ছ জ Leetaru, Kalev (২৮ জানুয়ারি ২০১৬)। "The Internet Archive Turns 20: A Behind the Scenes Look at Archiving the Web"। Forbes। ১৬ অক্টোবর ২০১৭ তারিখে মূল থেকে আর্কাইভকৃত। সংগ্রহের তারিখ ১৬ অক্টোবর ২০১৭।
- ↑ "Internet Archive: Wayback Machine"। Internet Archive। ৩ জানুয়ারি ২০১৪ তারিখে মূল থেকে আর্কাইভকৃত। সংগ্রহের তারিখ ১৫ অক্টোবর ২০১৮।
- ↑ Graham, Mark (৩০ অক্টোবর ২০২০)। "Fact Checks and Context for Wayback Machine Pages"। Internet Archive Blogs। সংগ্রহের তারিখ ১৭ জানুয়ারি ২০২১।
- ↑ ‘save page now’ ফিচার ব্যবহার করে tpc.googlesyndication.com, s0.2mdn.net, atdmt.com বা adbrite.com সংরক্ষণ করতে গেলে "This URL is in our block list and cannot be captured." এই বার্তা দেখায়।
- ↑ "Internet Archive 25th Anniversary – Universal Access to All Knowledge"। সংগ্রহের তারিখ ১৩ জানুয়ারি ২০২২।
- ↑ "Wayforward Machine • Visit the future of the internet"। Way Forward Machine। সংগ্রহের তারিখ ১৩ জানুয়ারি ২০২২।
- ↑ Kahle, Brewster। "Archiving the Internet"। Scientific American – March 1997 Issue। ৩ এপ্রিল ২০১২ তারিখে মূল থেকে আর্কাইভকৃত। সংগ্রহের তারিখ ১৯ আগস্ট ২০১১।
- ↑ Kaplan, Jeff (২৭ অক্টোবর ২০১৪)। "Archive-It: Crawling the Web Together"। Internet Archive Blogs। ১২ অক্টোবর ২০১৭ তারিখে মূল থেকে আর্কাইভকৃত। সংগ্রহের তারিখ ১৬ অক্টোবর ২০১৭।
- ↑ "Frequently Asked Questions - Archiveteam"। wiki.archiveteam.org। সংগ্রহের তারিখ ২৬ মে ২০২৫।
- ↑ "Worldwide Web Crawls"। Internet Archive। ১৯ অক্টোবর ২০১৭ তারিখে মূল থেকে আর্কাইভকৃত। সংগ্রহের তারিখ ১৬ অক্টোবর ২০১৭।
- ↑ ক খ Graham, Mark (১৭ সেপ্টেম্বর ২০২০)। "Cloudflare and the Wayback Machine, joining forces for a more reliable Web"। Internet Archive Blogs। সংগ্রহের তারিখ ১৭ সেপ্টেম্বর ২০২০।
- ↑ ক খ "Using The Wayback Machine"। Internet Archive। সংগ্রহের তারিখ ২৫ সেপ্টেম্বর ২০২৪।
- ↑ "Wide Crawl Number 13"। Internet Archive। ১৯ অক্টোবর ২০১৭ তারিখে মূল থেকে আর্কাইভকৃত। সংগ্রহের তারিখ ১৬ অক্টোবর ২০১৭।
- ↑ ক খ Rossi, Alexis (২৫ অক্টোবর ২০১৩)। "Fixing Broken Links on the Internet"। Internet Archive। ৭ নভেম্বর ২০১৪ তারিখে মূল থেকে আর্কাইভকৃত। সংগ্রহের তারিখ ২৯ ডিসেম্বর ২০১৩।
- ↑ "Wayback Machine main page"। Internet Archive। ৩ জানুয়ারি ২০১৪ তারিখে মূল থেকে আর্কাইভকৃত। সংগ্রহের তারিখ ৩০ ডিসেম্বর ২০১৩।
- ↑ "Too Many Requests"। Internet Archive। ১০ নভেম্বর ২০১৯। সংগ্রহের তারিখ ২৭ নভেম্বর ২০২১।
- ↑ "Petabox"। Internet Archive। সংগ্রহের তারিখ ২৫ অক্টোবর ২০১৮।
- ↑ Kanellos, Michael (২৯ জুলাই ২০০৫)। "Big storage on the cheap"। CNET News। ৩ এপ্রিল ২০০৭ তারিখে মূল থেকে আর্কাইভকৃত। সংগ্রহের তারিখ ২৯ জুলাই ২০০৭।
- ↑ "Internet Archive and Sun Microsystems Create Living History of the Internet"। Sun Microsystems। ২৫ মার্চ ২০০৯। ২৬ মার্চ ২০০৯ তারিখে মূল থেকে আর্কাইভকৃত। সংগ্রহের তারিখ ২৭ মার্চ ২০০৯।
- ↑ Mearian, Lucas (১৯ মার্চ ২০০৯)। "Internet Archive to unveil massive Wayback Machine data center"। Computerworld। ২৩ মার্চ ২০০৯ তারিখে মূল থেকে আর্কাইভকৃত। সংগ্রহের তারিখ ২২ মার্চ ২০০৯।
- ↑ "Internet Archive Forums: 6th pair of racks go into service: over 2PB of data space used"। Internet Archive। ২৪ অক্টোবর ২০১৬ তারিখে মূল থেকে আর্কাইভকৃত। সংগ্রহের তারিখ ২৫ অক্টোবর ২০১৮।
- ↑ "Wayback Machine: Now with 240,000,000,000 URLs | Internet Archive Blogs"। ৯ জানুয়ারি ২০১৩। ১৪ এপ্রিল ২০১৪ তারিখে মূল থেকে আর্কাইভকৃত। সংগ্রহের তারিখ ১৬ এপ্রিল ২০১৪।
- ↑ Rossi, Alexis (২৫ অক্টোবর ২০১৩)। "Fixing Broken Links on the Internet"। Internet Archive। San Francisco, CA, US: Collections Team, the Internet Archive। ৭ নভেম্বর ২০১৪ তারিখে মূল থেকে আর্কাইভকৃত। সংগ্রহের তারিখ ২৫ মার্চ ২০১৫।
- ↑ Baron, Alexander (২৩ অক্টোবর ২০১৩)। "The new Internet Archive Wayback Machine now online"। Digital Journal। ১৯ নভেম্বর ২০২০ তারিখে মূল থেকে আর্কাইভকৃত। সংগ্রহের তারিখ ১৯ নভেম্বর ২০২০।
- ↑ "Wayback Machine APIs"। Internet Archive।
- ↑ গিটহাবে waybackpy
- ↑ "Developers"। Internet Archive Blogs। ২২ আগস্ট ২০১৪। ১২ ফেব্রুয়ারি ২০২৪ তারিখে মূল থেকে আর্কাইভকৃত।
- ↑ Gonzalez, John (১৩ ডিসেম্বর ২০১৮)। "Documentation for Public APIs at the Internet Archive"। Internet Archive Blogs। ১৩ জানুয়ারি ২০২৪ তারিখে মূল থেকে আর্কাইভকৃত।
- ↑ "FAQs – Some sites are not available because of Robots.txt or other exclusions. What does that mean?"। Internet Archive Wayback Machine। ১৫ এপ্রিল ২০১১ তারিখে মূল থেকে আর্কাইভকৃত।
- ↑ "Frequently Asked Questions"। Internet Archive। ১৭ এপ্রিল ২০১৪ তারিখে মূল থেকে আর্কাইভকৃত।
- ↑ Cox, Joseph (২২ মে ২০১৮)। "The Wayback Machine Is Deleting Evidence of Malware Sold to Stalkers"। Vice। ২২ মে ২০১৮ তারিখে মূল থেকে আর্কাইভকৃত। সংগ্রহের তারিখ ২৩ মে ২০১৮।
- ↑ "Robots.txt meant for search engines don't work well for web archives"। Internet Archive। ১৭ এপ্রিল ২০১৭। সংগ্রহের তারিখ ২৯ জুন ২০১৯।
- ↑ "Recommendations for Managing Removal Requests And Preserving Archival Integrity"। ক্যালিফোর্নিয়া বিশ্ববিদ্যালয়। ১৪ ডিসেম্বর ২০০২। ২ মে ২০০৩ তারিখে মূল থেকে আর্কাইভকৃত। সংগ্রহের তারিখ ২০ অক্টোবর ২০২৪।
- ↑ "Retroactive robots.txt removal of past crawls AKA Oakland Archive Policy"। Internet Archive। ৭ জুলাই ২০১৪। ১০ অক্টোবর ২০১৭ তারিখে মূল থেকে আর্কাইভকৃত। সংগ্রহের তারিখ ১৪ সেপ্টেম্বর ২০১৭।
- ↑ Graham, Mark (১৭ এপ্রিল ২০১৭)। "Robots.txt meant for search engines don't work well for web archives"। Internet Archive Blogs। ১৭ এপ্রিল ২০১৭ তারিখে মূল থেকে আর্কাইভকৃত। সংগ্রহের তারিখ ১৬ এপ্রিল ২০১৭।
- ↑ "Archivierung des Internets: Internet Archive ignoriert künftig robots.txt" (জার্মান ভাষায়)। heise online। ২৫ এপ্রিল ২০১৭। ২৭ এপ্রিল ২০১৭ তারিখে মূল থেকে আর্কাইভকৃত। সংগ্রহের তারিখ ১৪ মে ২০১৭।
- ↑ "Suchmaschinen: Internet Archive will künftig Robots.txt-Einträge ignorieren – Golem.de" (জার্মান ভাষায়)। ১৯ জুন ২০১৭ তারিখে মূল থেকে আর্কাইভকৃত। সংগ্রহের তারিখ ১৪ মে ২০১৭।
- ↑ "Internet Archive will ignore robots.txt files to keep historical record accurate"। Digital Trends। ২৪ এপ্রিল ২০১৭। ১৬ মে ২০১৭ তারিখে মূল থেকে আর্কাইভকৃত। সংগ্রহের তারিখ ১৪ মে ২০১৭।
- ↑ Sampath Kumar, B.T.; Prithviraj, K.R. (২১ অক্টোবর ২০১৪)। "Bringing life to dead: Role of Wayback Machine in retrieving vanished URLs"। Journal of Information Science। ৪১ (1): ৭১–৮১। ডিওআই:10.1177/0165551514552752। আইএসএসএন 0165-5515। এস২সিআইডি 28320982।
- ↑ ক খ Nelson, Steven (১৭ আগস্ট ২০১৬)। "Wayback Machine Won't Censor Archive for Taste, Director Says After Olympics Article Scrubbed"। U.S. News & World Report। ৬ জানুয়ারি ২০১৭ তারিখে মূল থেকে আর্কাইভকৃত। সংগ্রহের তারিখ ১৪ মে ২০১৭।
- ↑ Lepore, Jill (২৬ জানুয়ারি ২০১৫)। "What the Web Said Yesterday"। The New Yorker। ২৫ জানুয়ারি ২০১৫ তারিখে মূল থেকে আর্কাইভকৃত। সংগ্রহের তারিখ ১৪ মে ২০১৭।
- ↑ Guarino, Ben (২১ এপ্রিল ২০১৭)। "The March for Science began with this person's 'throwaway line' on Reddit"। Washington Post। ২৩ এপ্রিল ২০১৭ তারিখে মূল থেকে আর্কাইভকৃত। সংগ্রহের তারিখ ২৩ এপ্রিল ২০১৭।
- ↑ Kaplan, Sarah (২৫ জানুয়ারি ২০১৭)। "Are scientists going to march on Washington?"। The Washington Post। ৩১ জানুয়ারি ২০১৭ তারিখে মূল থেকে আর্কাইভকৃত। সংগ্রহের তারিখ ৩১ জানুয়ারি ২০১৭।
- ↑ Foley, Katherine Ellen (২২ এপ্রিল ২০১৭)। "The global March for Science started with a single Reddit thread"। Quartz। ২৪ এপ্রিল ২০১৭ তারিখে মূল থেকে আর্কাইভকৃত। সংগ্রহের তারিখ ২৩ এপ্রিল ২০১৭।
- ↑ ক খ Graham, Mark (১ অক্টোবর ২০১৮)। "More than 9 million broken links on Wikipedia are now rescued"। Internet Archive Blogs। ৮ এপ্রিল ২০২৩ তারিখে মূল থেকে আর্কাইভকৃত।
বহিঃসংযোগ
সম্পাদনাএই নিবন্ধটি অসম্পূর্ণ। আপনি চাইলে এটিকে সম্প্রসারিত করে উইকিপিডিয়াকে সাহায্য করতে পারেন। |