Како отворити заиста велике текстуалне и ЦСВ датотеке

МС Екцел(MS Excel) може приказати 1.048.576 редова. Иако то може изгледати као заиста велики број у нормалној употреби, постоји много сценарија у којима то није сасвим довољно.

Без обзира да ли гледате датотеке евиденције или велике скупове података, лако је наићи на ЦСВ(CSV) датотеке са милионима редова или огромним текстуалним датотекама. Пошто Екцел(Excel) не може да подржи датотеке овако велике, како их тачно отворити? Хајде да сазнамо.

Зашто нормални уређивачи текста(Normal Text Editors) не могу да отворе заиста велике датотеке(Open Really Large Files) ?

Рачунар има гигабајте складишног простора, па зашто уређивачи текста не могу да отворе велике датотеке?

Овде су у игри два фактора. Неке апликације имају чврсто кодирано ограничење колико података могу да прикажу. Није важно колико меморије ваш рачунар има, они је једноставно неће користити.

Друго питање је РАМ(RAM) . Многи уређивачи текста немају строго ограничење броја редова, али не могу да прикажу велике датотеке због ограничења меморије. Они учитавају целу датотеку у системску РАМ меморију(RAM) , тако да ако ова меморија није довољно велика, процес неће успети.

Метод #1: Коришћење бесплатних уређивача

Најбољи начин да видите изузетно велике текстуалне датотеке је да користите... уређивач текста. Не било који уређивач текста, већ алати за писање кода. Такве апликације обично могу да обрађују велике датотеке без проблема и бесплатне су.

Ларге Тект Филе Виевер(Large Text File Viewer) је вероватно најједноставнији од ових апликација. Заиста је једноставан за коришћење, ради брзо и има веома мали отисак ресурса. Једина мана? Не може да уређује датотеке. Али ако желите да видите само велике ЦСВ(CSV) датотеке, ово је најбољи алат за посао.

За уређивање великих текстуалних датотека такође, требало би да испробате Емацс(Emacs) . Првобитно креиран за Уник(Unix) системе, савршено добро функционише и на Виндовс(Windows) -у и може да обрађује велике датотеке. Слично томе, Неовим(Neovim) и Сублиме Тект(Sublime Text) су два лагана ИДЕ -а која се могу користити за отварање (IDEs)ЦСВ(CSV) текстуалних датотека величине гигабајта .

Ако је све што тражите да тражите податке кроз велике датотеке евиденције, онда је клогг(klogg) само алат за вас. Ажурирајућа виљушка популарног глогг-а(glogg) , ова апликација вам омогућава да са лакоћом обављате сложене операције претраживања кроз огромне текстуалне датотеке. Пошто компјутерски генерисане датотеке дневника често могу да имају милионе редова, клогг је дизајниран да ради са таквим величинама датотека без проблема.

Метод(Method) #2: Поделити на више делова(Into Multiple Parts)

Читав проблем са покушајем отварања великих ЦСВ(CSV) датотека је у томе што су превелике. Али шта ако бисте их поделили на више мањих датотека?

Ово је популарно решење, јер углавном не укључује учење интерфејса новог уређивача текста. Уместо тога, можете да користите један од многих ЦСВ разделника доступних на мрежи(one of the many CSV splitters available online) да бисте поделили велику датотеку на бројне датотеке које се лако отварају. Свакој од ових датотека се тада може нормално приступити.

Међутим, ово није најбољи начин да се ово уради. Раздвајање велике датотеке често може довести до чудних грешака у куцању или неправилно конфигурисаних датотека. Штавише, отварање сваког дела засебно спречава вас да филтрирате читаве податке одједном.

Метод #3: Увоз у базу података

Текстуалне и .цсв датотеке које се протежу на више гигабајта су углавном велики скупови података. Па зашто их једноставно не увезете у базу података?

СКЛ(SQL) је најчешћи језик за означавање базе података који се користи ових дана. Постоји много верзија СКЛ-(many versions of SQL) а у употреби, али најлакша је вероватно МиСКЛ(MySQL) . И на срећу, могуће је претворити ЦСВ датотеку у МиСКЛ табелу(convert a CSV file into a MySQL table) .

Ово никако није најлакши метод за рад са великим ЦСВ(CSV) датотекама, па ово препоручујемо само ако желите да редовно радите са великим скуповима података. Ако МиСКЛ(MySQL) звучи превише тешко, увек можете да увезете своје .цсв датотеке у МС Аццесс(MS Access) .

Метод(Method) #4: Анализирајте помоћу Питхон(Python) библиотека

Када радите са .цсв датотеком са милионима редова података, очигледно нећете моћи да је схватите ручно. Вероватно желите да филтрирате податке и покренете одређене упите да бисте разумели трендове.

Па зашто не бисте написали Питхон код(write Python code) да бисте управо то урадили?

Још једном, ово није метод који је најприкладнији за употребу. Иако Питхон није најтежи програмски језик за учење(Python isn’t the hardest programming language to learn) , он је кодирање, тако да можда није најбољи приступ за вас. Ипак, ако приметите да морате свакодневно да анализирате заиста велике ЦСВ датотеке, можда бисте желели да (CSV)аутоматизујете задатак помоћу неког Питхон кода(automate the task with some Python code) .

Метод #5: Са премиум алатима

Уређивачи текста које смо видели у првој методи нису били наменски алати намењени за ЦСВ(CSV) обраду. Били су то алати опште намене који су се могли користити и за рад са великим .цсв датотекама.

Али шта је са специјализованим апликацијама? Зар не постоје апликације које су креиране да реше овај проблем?

Постоје, заправо. ЦСВ Екплорер(CSV Explorer) , на пример, гради на самом процесу који смо описали у последње две методе ( СКЛ(SQL) база података и Питхон(Python) код) за креирање апликације која може да прегледа и уређује ЦСВ(CSV) датотеке било које величине. Можете да урадите све што очекујете од алатке за прорачунске табеле, као што је прављење графикона или филтрирање података у ЦСВ Екплорер(CSV Explorer) -у .

Друга опција је УлтраЕдит(UltraEdit) . За разлику од претходног алата, ово није намењено само за .цсв датотеке већ за било коју врсту текстуалне датотеке. Може лако да обрађује текстуалне и ЦСВ(CSV) датотеке у распону од неколико гигабајта, са интерфејсом сличним многим бесплатним уређивачима о којима смо раније говорили. 

Једини недостатак ових алата је то што су то премиум апликације, које захтевају да добијете плаћену лиценцу да бисте могли да их користите. Увек можете испробати њихове бесплатне пробне верзије да бисте проверили њихове карактеристике или ако имате само једнократну употребу.

Који је најбољи начин за отварање великих текстуалних(Large Text) и ЦСВ датотека(CSV Files) ?

У овом добу великих података(Big Data) , није неуобичајено да налетите на текстуалне датотеке које се крећу у гигабајтима, што може бити тешко чак и прегледати помоћу уграђених алата као што су Нотепад(Notepad) или МС Екцел(MS Excel) . Да бисте могли да отворите тако велике ЦСВ(CSV) датотеке, морате да преузмете и користите апликацију треће стране.

Ако је све што желите да видите такве датотеке, онда је Ларге Тект Филе Виевер(Large Text File Viewer) најбољи избор за вас. Да бисте их стварно уређивали, можете испробати уређивач текста богат функцијама као што је Емацс(Emacs) или изабрати премиум алат као што је ЦСВ Екплорер(CSV Explorer) .

Технике попут раздвајања ЦСВ(CSV) датотеке или увоза у базу података укључују превише корака. Боље вам је да набавите плаћену лиценцу наменског премиум алата ако често радите са огромним текстуалним датотекама.



About the author

Ја сам информатичар са преко 10 година искуства у раду у области претраживача, Мицрософт оффице-а и онедриве-а. Специјализовао сам се за веб развој, истраживање корисничког искуства и развој апликација великих размера. Моје вештине користе неке од водећих светских компанија, укључујући Гоогле, Фацебоок и Аппле.



Related posts