В диком интернете нет (и не может быть) никакого порядка, в именовании файлов изображений. Это хорошо ещё, если картинку на хостинг закачивает вебмастер своими руками по фтп: в большинстве случаев имя файла будет относительно осмысленным, а вот если это происходит через веб-форму для аплоада, то имя, которое в итоге получит файл, остаётся на
(
Read more... )
Comments 21
http://hpaste.org/81641
Reply
["clip","image","001"]
["52","Untitled","1","Copy"]
["main","full"]
["Copy","2","of","IMG","4743"]
["Oceans","Twelve","Poster"]
["2494","cd","87","d","Tulips"]
["Small","201191981250","Tulips"]
["toyota","corolla","altis","2","0"]
["Corolla","20","Altis","202010"]
["drawing","last","kiss","icey","cassvn","1024","x","768"]
["PHOTO","of","ME","44"]
Reply
у тебя проще и короче, но вот так-то как-нибудь ещё короче :)
% echo "ThePHOTOofME14==9AndMyCat8see" | \
perl -ple 's#\W+# #g;s#([A-Z])([a-z])|([A-Za-z])(\d)#$1$3 $2$4#g;s#([a-z])([A-Z])|(\d)([A-Za-z])#$1$3 $2$4#g;s#(^|[^A-Z])([A-Z]) ([a-z])#$1$2$3#g'
The PHOTO of ME 14 9 And My Cat 8 see
А в посте я пытался продемонстрировать сишный fsm на стероидах, но, видимо, в шесть ночи мысль уже сложно правильно подать =)
Попробуй изобразить решение, которое будет работать в один проход и с одной аллокацией, и у тебя тоже должна получиться простыня.
Reply
А во-вторых, это решение и работает в один проход, да ещё и лениво. Я могу докладывать в хвост по одному символу и на выходе получать всё новые элементы.
Единственное, что в данном решении мешает, - это takeBaseName.
Reply
Reply
Reply
Изначально у citeseer были регексы, теперь регексы только для вырезания библиографии остались, а весь разбор идет этой библиотекой.
PS тут ведь всего надо два тега проставить или символ "часть слова", или "разделитель".
Reply
Reply
Reply
( ... )
Reply
Reply
Reply
Leave a comment