تنزيل عدد عشوائي من الملفات من عنوان URL مع urllib2 في Python 2.7. ما يعادل "os.walk" لـ urllib2؟

أرغب في تنزيل جميع الملفات في دليل معين على عنوان URL معروف. لن تكون أسماء الملفات معروفة بالضرورة ، ولكن أسماءها تحتوي على كلمة رئيسية مشتركة ، وسيكون لها نفس الامتداد (xml.).

هل هناك ما يعادل "os.walk" لـ urllib2 ، بحيث يمكنني ببساطة المرور عبر أي ملفات موجودة في الدليل وفتحها للتحليل؟

الأمثلة الوحيدة لهذا رأيت على الإنترنت تنطوي على ملف اسم معروف الذي يحتوي على قائمة بجميع أسماء الملفات في الدليل. لا اريد ان اعمل هذا...

معلومات أخرى قد تكون ذات صلة: الملفات موجودة على خادم أباتشي ، ويمكن الوصول إليها بشكل عام.

0
انها في الواقع البيانات الخاصة بي. أريد فقط أن أكون قادراً على سحبها مع البرنامج النصي الخاص بي تلقائيًا دون الحاجة إلى تحديث قائمة الملفات في الدليل في كل مرة يتم فيها التحديث ... ربما سأفعل ذلك على أي حال.
وأضاف المؤلف user1472893, مصدر
الاتصال بمالك الموقع وسؤاله عما إذا كان يرغب في تقديم البيانات
وأضاف المؤلف dm03514, مصدر

1 إجابة

هذا مستحيل دون معرفة أسماء الملفات - سيكون عليك محاولة كل اسم ممكن عشوائيًا ، لأن طريقتك الوحيدة لمعرفة ما إذا كان الملف الذي يحمل هذا الاسم موجودًا أم لا ، فهو يطلب عنوان url ومعرفة ما إذا كنت تحصل على رد. ولكن يمكنك السماح لخادم الويب Apache بإنشاء فهرس دليل لك (باستخدام mod_autoindex ) وتعديل هذا للحصول على أسماء الملفات.

0
وأضاف