Power Query vasitəsilə məlumatları PDF-dən Excel-ə idxal edin

Məlumatların PDF faylındakı elektron cədvəldən Microsoft Excel vərəqinə ötürülməsi işi həmişə “əyləncəlidir”. Xüsusilə FineReader və ya buna bənzər bahalı tanınma proqramınız yoxdursa. Birbaşa surət çıxarmaq adətən yaxşı heç nəyə gətirib çıxarmır, çünki. kopyalanan məlumatları vərəqə yapışdırdıqdan sonra, çox güman ki, bir sütuna "bir-birinə yapışacaqlar". Beləliklə, onlar bir alətdən istifadə edərək zəhmətlə ayrılmalı olacaqlar Sütunlar üzrə mətn tabdan Tarix (Məlumatlar - Mətn Sütunlara).

Və əlbəttə ki, kopyalama yalnız mətn qatının olduğu PDF faylları üçün mümkündür, yəni kağızdan PDF-ə yeni skan edilmiş sənədlə bu, prinsipcə işləməyəcəkdir.

Amma o qədər də kədərli deyil, həqiqətən 🙂

Office 2013 və ya 2016-nız varsa, bir neçə dəqiqə ərzində əlavə proqramlar olmadan məlumatları PDF-dən Microsoft Excel-ə köçürmək olduqca mümkündür. Word və Power Query bu işdə bizə kömək edəcək.

Məsələn, Avropa İqtisadi Komissiyasının internet saytından mətn, düstur və cədvəllərdən ibarət bu PDF hesabatını götürək:

Power Query vasitəsilə məlumatları PDF-dən Excel-ə idxal edin

… və Excel-də onu çıxarmağa çalışın, ilk cədvəli deyin:

Power Query vasitəsilə məlumatları PDF-dən Excel-ə idxal edin

Gedək!

Addım 1. Word-də PDF açın

Nədənsə az adam bilir, lakin 2013-cü ildən Microsoft Word PDF fayllarını (hətta skan edilmiş, yəni mətn qatı olmadan!) açmağı və tanımağı öyrəndi. Bu, tamamilə standart şəkildə edilir: Word-ü açın, vurun Fayl - Açıq (Fayl — Açıq) və pəncərənin aşağı sağ küncündə açılan siyahıda PDF formatını təyin edin.

Sonra bizə lazım olan PDF faylını seçin və üzərinə klikləyin açıq (Açıq). Word bizə mətn üçün bu sənəddə OCR işlətəcəyini söyləyir:

Power Query vasitəsilə məlumatları PDF-dən Excel-ə idxal edin

Razılaşırıq və bir neçə saniyədən sonra PDF-imizin artıq Word-də redaktə üçün açıq olduğunu görəcəyik:

Power Query vasitəsilə məlumatları PDF-dən Excel-ə idxal edin

Əlbəttə ki, dizayn, üslublar, şriftlər, başlıqlar və altbilgilər və s. qismən sənəddən kənara çıxacaq, lakin bu bizim üçün vacib deyil - bizə yalnız cədvəllərdən məlumat lazımdır. Prinsipcə, bu mərhələdə cədvəli sadəcə olaraq tanınan sənəddən Word-ə köçürmək və sadəcə Excel-ə yapışdırmaq cazibədardır. Bəzən işləyir, lakin daha tez-tez hər cür məlumat təhriflərinə səbəb olur - məsələn, nömrələr tarixlərə çevrilə bilər və ya bizim vəziyyətimizdə olduğu kimi mətn olaraq qala bilər, çünki. PDF ayırıcı olmayanlardan istifadə edir:

Power Query vasitəsilə məlumatları PDF-dən Excel-ə idxal edin

Beləliklə, küncləri kəsməyək, amma hər şeyi bir az daha mürəkkəb hala gətirək, amma doğru.

Addım 2: Sənədi Veb Səhifə kimi Saxlayın

Sonra alınan məlumatları Excel-ə yükləmək üçün (Power Query vasitəsilə) Word-dəki sənədimiz veb-səhifə formatında saxlanmalıdır – bu format, bu halda Word və Excel arasında bir növ ortaq məxrəcdir.

Bunu etmək üçün menyuya keçin Fayl - Fərqli Saxla (Fayl — Fərqli Saxla) və ya düyməni basın F12 klaviaturada və açılan pəncərədə fayl növünü seçin Veb səhifə bir faylda (Veb-səhifə — Tək fayl):

Power Query vasitəsilə məlumatları PDF-dən Excel-ə idxal edin

Saxladıqdan sonra mhtml uzantılı bir fayl almalısınız (Explorer-də fayl uzantılarını görürsünüzsə).

Mərhələ 3. Faylın Power Query vasitəsilə Excel-ə yüklənməsi

Yaradılmış MHTML faylını birbaşa Excel-də aça bilərsiniz, lakin sonra biz, ilk növbədə, PDF-nin bütün məzmununu mətn və bir sıra lazımsız cədvəllərlə birlikdə alacağıq və ikincisi, səhvlər səbəbindən məlumatları yenidən itirəcəyik. ayırıcılar. Beləliklə, Power Query əlavəsi vasitəsilə Excel-ə idxal edəcəyik. Bu, demək olar ki, hər hansı bir mənbədən (fayllar, qovluqlar, verilənlər bazası, ERP sistemləri) Excel-ə məlumat yükləyə və sonra alınan məlumatları istənilən formada istənilən şəkildə çevirə biləcəyiniz tamamilə pulsuz bir əlavədir.

Əgər sizdə Excel 2010-2013 varsa, o zaman Power Query-ni rəsmi Microsoft veb saytından yükləyə bilərsiniz – quraşdırmadan sonra bir nişanı görəcəksiniz. Güc sorğusu. Əgər Excel 2016 və ya daha yeni versiyanız varsa, onda heç nə yükləməyinizə ehtiyac yoxdur – bütün funksiyalar artıq standart olaraq Excel-də qurulub və nişanda yerləşir. Tarix (Tarix) qrupda Yükləyin və çevirin (Alın və çevirin).

Beləliklə, ya nişana gedirik Tarix, və ya tabda Güc sorğusu və komanda seçin Məlumat əldə etmək üçün or Sorğu yaradın - Fayldan - XML-dən. Yalnız XML fayllarını deyil, görünən etmək üçün pəncərənin aşağı sağ küncündə açılan siyahıda filtrləri dəyişdirin. Bütün sənədlər (Bütün fayllar) və MHTML faylımızı təyin edin:

Power Query vasitəsilə məlumatları PDF-dən Excel-ə idxal edin

Nəzərə alın ki, idxal uğurla başa çatmayacaq, çünki. Power Query bizdən XML gözləyir, lakin bizim əslində HTML formatımız var. Buna görə də, görünən növbəti pəncərədə Power Query üçün anlaşılmaz faylı sağ klikləməlisiniz və onun formatını təyin etməlisiniz:

Power Query vasitəsilə məlumatları PDF-dən Excel-ə idxal edin

Bundan sonra fayl düzgün şəkildə tanınacaq və onun tərkibində olan bütün cədvəllərin siyahısını görəcəyik:

Power Query vasitəsilə məlumatları PDF-dən Excel-ə idxal edin

Data sütununun xanalarının ağ fonunda (Cədvəl sözündə deyil!) sol siçan düyməsini sıxmaqla cədvəllərin məzmununa baxa bilərsiniz.

İstədiyiniz cədvəl müəyyən edildikdə, yaşıl sözə klikləyin Masa – və onun məzmununa “düşürsən”:

Power Query vasitəsilə məlumatları PDF-dən Excel-ə idxal edin

Tərkibini "daramaq" üçün bir neçə sadə addım atmaq qalır, yəni:

  1. lazımsız sütunları silin (sütun başlığına sağ vurun - Aradan qaldırılması)
  2. nöqtələri vergüllə əvəz edin (sütunları seçin, sağ klikləyin - Dəyərlərin dəyişdirilməsi)
  3. başlıqdakı bərabər işarələri silin (sütunları seçin, sağ klikləyin - Dəyərlərin dəyişdirilməsi)
  4. üst xətti çıxarın (Əsas səhifə – Sətirləri silin – Üst sətirləri silin)
  5. boş sətirləri çıxarın (Ev - Sətirləri sil - Boş sətirləri sil)
  6. birinci sıranı cədvəlin başlığına qaldırın (Əsas səhifə – Başlıq kimi birinci sətirdən istifadə edin)
  7. bir filtrdən istifadə edərək lazımsız məlumatları süzün

Cədvəl normal formaya gətirildikdə, əmri ilə onu vərəqə boşaltmaq olar bağlayın və yükləyin (Bağla və Yüklə) on əsas nişanı. Və biz artıq işləyə biləcəyimiz gözəlliyi əldə edəcəyik:

Power Query vasitəsilə məlumatları PDF-dən Excel-ə idxal edin

  • Power Query ilə Sütunun Cədvələ çevrilməsi
  • Yapışqan mətnin sütunlara bölünməsi

Cavab yaz