About |
Terms, Privacy & Copyright
european digital archive

The european digital archive

spacer
spacer
Terms, Copyright & Privacy
spacer

Jobs

Web Crawler Engineer

The European Web Archive is seeking a Web Crawler Engineer to help us archive the Internet and preserve this information for future generations! We are starting a web archive team based in Paris. Find out more about our organization and web archive at www.europarchive.org

Your responsibilities include:

  • Running an open source web crawler to collect content from the Internet. You can find out more about the crawler at crawler.archive.org
  • Analysis of content collected from the Internet to ensure it is complete and of highest quality
  • Development of tools for automated analysis and reporting of crawl material
  • Monitoring all production systems using automated tools
  • Working directly with our partner National Libraries, Archives and Universities to collect specific content on the Internet for preservation
  • Contribute to the development of the open source crawler and related access/analysis tools

Experience Needed:

  • Extensive use of Perl and Linux shell scripting
  • Experience in coding with Java
  • Experience in Internet protocols (HTTP is a must have)
  • Working knowledge of HTML, Javascript and Web technologies in general
  • Linux administration is a plus
  • Able to work in loosely structured start up work environment

Education:

  • Computer Science Bachelor, Master or equivalent work experience

Please send your resume and cover letter to jobs at europarchive dot org with the subject line "Web Crawl Engineer". The European Archive thanks all applicants for their interest, but advises that only those selected for an interview will be contacted.

Archiviste du Web

Profil de poste :

Le poste comprend trois activités principales :
  • Planification, suivi et contrôle-qualité des captures de sites. Cela comprend la visualisation des pages archivées, le repérage des éléments manquants, une première analyse des problèmes techniques en s'appuyant sur la consultation des pages sources et des journaux de capture si besoin est.
  • Gestion des relations utilisateurs, évaluation des besoins et suivi du planning des opérations de capture.
  • Participation aux évolutions des outils d'archivage sous forme de contribution aux spécifications fonctionnelles.

Compétences requises :

  • Le/la candidat(e) aura une expérience dans le domaine de l'archivage du Web. Il/elle aura participé à des vérifications de captures et aura une bonne connaissance des outils d'archivage existant.
  • Il/elle aura déjà une expérience dans le domaine de l'évaluation et/ou de la spécification d'outils d'archivage du Web.
  • Le/la candidate(e) aura également une expérience de suivi de relation utilisateur, de préférence dans ce domaine mais également, à défaut, dans un autre, et aura montré une capacité à intégrer cette dimension à son activité
  • Une maîtrise parfaite du Français et de l'Anglais, écrit comme parlé, est nécessaire.
  • Une bonne connaissance du Web et de ses standards (HTML, CSS etc.) est souhaitée.
spacer spacer
spacer
spacer