Skip to main content

Posts

Showing posts from July, 2012

OpenMeeting - Lovely announcement from Apache

Just got this good news from Apache. Not it will be more fruitful to use openmeeting for online meetings and conferences.
----

We are happy to announce Version 2.0 of Apache OpenMeetings [Incubating]! This is our first release as Apache project and there have been major changes almost everywhere in the application. Restyled UI The UI has been refactored to have a common look and feel. Additionally most of the icons are now loaded at runtime. That means you can change colors and icons at runtime without changing the source code. More info:http://incubator.apache.org/openmeetings/themes-and-branding.html New Calendar The calendar was completely refactored and got a new UI that was built from scratch that also adds some new functions. For example it is possible now to password protect invitations sent via the calendar. Further the timezone handling has been refactored and there is now also a SOAP/REST API to handle calendar Events ( http://incubator.apache.org/openmeetings/SoapRestAPI.htm…

How to generate snippets in solr?

Snippet generation in the solr with lucene highlight is simple to configure task. Now with the advanced versions of he solr the snippet geneation works just fine bedefault. But there is need for change in the request.
To get the search results highlighted with the search terms in them and also to get the snippets i.e relevant text parts for users for deciding the relevance of the specific search results, you have to query the solr with parameters hl and hl.fl set to 'true' and 'filed name like title/content' etc.
Ex. Your query for the locally setup solr will be
http://localhost:8983/solr/select/?q=learning%20management%20systems&version=2.2&start=0&rows=10&indent=on&hl=true&hl.fl=CONTENT
where CONTENT is my name of my field which may be different for others.

And the highlighted part of the results occure at the botton after the results tag, as .
And in that the search terms are enclosed in the tags.

भुरकट

खूप अंतर चालून आल्यावर सगळेच भुरकट दिसते. तेच आयुष्याचे. जशी वेळ निघून जाईल आणि वय वाढत जाईल तशाच आठवणी ही भुरकट होतात. आठवणीच नव्हे तर आयुष्यातील जुन्या लोकांचे, मित्रांचे, ‘मैत्रिणींचे’, शिक्षकांचे चेहरेही भुरकट होतात. अंधुक होतात. आणि तीच गोष्ट आयुष्याला जवळुन स्पर्श केलेल्या वस्तूंची, वासांची आणि सवयींचीही. आपण म्हणत नाही का मी दहावीत असतांना खूप पहाटे उठायचो. मी लहान असतांना कशालाच नाही भ्यायचो. मी दिवाळीत सुगंधी उटणे लावून नहायचो. लाल भडक रंगाचा शर्ट घालायचो. सकाळी सकाळी मारोतीच्या पाया पडल्याशिवाय इतर काहीच नाही करायचो. मला बदाम तेलाचा सुगंध खूप आवडायचा. गोड खूप आवडायच. मी दुध नाही प्यायचो वगैरे वगैरे. अशा या अनेक गोष्टी आपण विसरतो म्हणा की एका कप्प्यात बांधून ठेवतो म्हणा; पण त्या कधी कधीच आठवतात. आयुष्यातून यातल्या बऱ्याच गोष्टींची फारकत होते. पण कुठे त्या दिसल्या की मग मात्र हळूच मन किती ही गर्दीत असल तरी मागे जात. धूसरचका होईना पण सगळ आठवायचा प्रयत्न करत. कधी कधी काही चेहरी आणि घटना पूर्ण आठवतच नाही. ‘त्या’ वेळी ‘ती’ नेमकी घरून शाळेत जात होती की शाळेतून घरी येत होती? नक्की …

Lucene Highlighter for snippet generation for search with solr

Here is a post which talks about the same and shows that there is such functionality available with lucene contrib itself and you may not need to build it on your own:
http://hrycan.com/2009/10/25/lucene-highlighter-howto/

It says that there is this contrib called lucene-highlighter-2.4.1.jar for generating the fragments or snippets for search results by using the term frequencies calculated while indexing.

The Contrib and other examples can be downloaded from the link http://code.google.com/p/hrycan-blog/ by the same author

पांडुरंग सांगवीकर

नेमकाच संविकारचा निरोप घेतला. हो, तेच सांगवीकर. पांडुरंग सांगवीकर. जे पुण्यात शिकले आणि पुढे गावात वसले. हो. हो. अगदी तेच. यान ही आणि आमची ओळख तंतोतंत म्हणजे अगदीच तंतोतंत ७ वर्षां पूर्वी जवळ पास याच महिन्यात म्हणजे उदाहरणार्थ जून मध्ये अगदी बरोबर पुण्याच्या नव्हे तर औरंगाबादच्या हनुमान टेकडीच्या खाली झाली. टेकडीच्या अगदी पायथ्याशी. पुन्हा मग यांचे भाऊ मागे काही महिन्यान खाली भेटले खंडेराव. त्यांना भेटल्यावर पुन्हा पांडुरंग सांगवीकर ची आठवण झाली. भेट घेण्याची इच्छा होती. पण बघ थोडा निवांत झाल्यावर म्हणून प्रोग्राम लांबवला शेवटी. मागच्या थर्सडे ला उक्कलगावला जाता जाता म्याजेस्टिक गाठले. एकदाचे सांगवीकर भेटले पण पुन्हा तीन दिवस मुंबईला परत येईपर्यंत त्यांच्याशी गप्पा मारता आल्या नाही. शेवटी आज संपलेल्या, हो हो म्हणजे १ तसा पूर्वी संपलेल्या विकडेज मध्ये त्यांच्याशी मन मोकळ्या गप्पा मारता आल्या. तसा या वेळेस संगाविकारांसोबत गप्पांचे विशेष प्रयोजन होते. कारण कळेलच काही दिवसात. असो. झोपा आता. म्हणजे आम्ही पहाटे झोपणार आहोतच. हे मात्र उदाहरणार्थ. शेवटी जागलेल्या झोपावे लागतेच …

Reading the weather Data

Reading the weather Data athttp://rtws.cdac.in/
     Vertical marks are latitudes and Horizontal marks are longitudes.
     Color intensities shows the amount of rainfall/day, like red part
has maximum
     rainfall of 32cm/day and light green part has got minimum
rainfall of .5cm/day.
     These are averaged rainfall/day calculated on total rainfall/year
divided by 365.

Handling the unrecognizable characters in Stanford Parser

Handling the unrecognizable characters in Stanford Parser/Tokenizer for warnings like :
WARNING: Unrecognizable .... U+FFD ... for some character.
You may find solution here :
http://nlp.stanford.edu/software/tokenizer.shtml
 i.e. untokenizable: What to do with untokenizable characters (ones not known to the tokenizer). Six options combining whether to log a warning for none, the first, or all, and whether to delete them or to include them as single character tokens in the output: noneDelete, firstDelete, allDelete, noneKeep, firstKeep, allKeep. The default is "firstDelete".