januari 31, 2004

epost-strul avslutat

Det är inte längre något strul att skicka och emotta mail.

Jaha, så har man gått med i Orkut (invite only). Det tog mer än en vecka innan jag helt opåkallandes (tack Magnus!) blev inviterad. Nu får vi se hur skoj det blir.

Det är många som skrivit om Orkut. Här är ett axplock.
Google Releases Orkut Social Networking Service
Why Google needs Orkut
Orkut Launch: The Good, The Bad, and the Ugly
Why Orkut Doesn't Work
Uppdatering och naturligtvis danah boyd.

januari 30, 2004

Ontology Review

Virtual Travelog kommer att skriva en serie om olika ontologier och dess öden: This is the first of an occasional series of reviews I intend to write to illustrate some important general traits of ontologies. In each review I will dissect an ontology and examine why it succeeded or failed.

Första artikeln är Ontology Review 1. The NHS Common Basic Specification. Why top level Ontologies don't work..

Det rekommenderas att även titta på de övriga avdelningarna på bloggen, t.ex. Complexity , System Design samt projektet The Evolution of the Modern Computer.

User-Centric Distributed Social Software

Eric Gradman: User-Centric Distributed Social Software är ett alternativ till de "centralistiska" lösningarna av social mjukvara.

For many years email and usenet news constituted the majority of the Internet's use as a tool to facilitate communication among individuals. The last five years have given rise to a number of novel applications in this domain---which has come to be known as "social software." Notable among these are instant messaging systems, weblogs, and services like Friendster and Tribe which exploit the concept of "six-degrees of separation."

These services generally employ centralized client-server architectures. These architectures are failing to adequately scale with the growing user-base. These services do not rely on open protocols; the user-base is fragmented among competing service providers. Users use numerous service providers to get the features they want, but have no easy way to maintain the consistency of their information on each.

This paper summarizes the ever changing state-of-the-art in social software, and presents an alternative to this "service-centric" view of social software. The novel user-centric distributed social software model outlined in this paper overcomes many of the limitations of the current model by drawing from ideas from the Semantic Web.

Ingenjörer bör studera komplexa system

Nature-artikeln Engineering complex systems (registrering krävs) är en uppmaning att även ingenjörskonsten bör ägna sig åt studier av komplexa system.

Complex systems can be identified by what they do (display organization without a central organizing authority — emergence), and also by how they may or may not be analysed (as decomposing the system and analysing sub-parts do not necessarily give a clue as to the behaviour of the whole). Systems that fall within the scope of complex systems include metabolic pathways, ecosystems, the web, the US power grid and the propagation of HIV infections.
Despite significant recent advances in our understanding of complex systems, the field is still in flux, and there is still is a lack of consensus as to where the centre is — for some, it is exclusively cellular automata; for others it is networks. However, the landscape is bubbling with activity, and now is the time to get involved. Engineering should be at the centre of these developments, and contribute to the development of new theory and tools.

Se även Julio M. Ottino (artikelförfattaren) och dennes forskningsgrupp Complex Systems and Nonlinear Dynamics in Fluids and Granular Materials

Tack Erik för pekningen.

januari 29, 2004


Till dem det berör:

Det är för närvarande strul med eposthanteringen: jag kan inte skicka eller ta emot några mail. Enligt leverantören ska det lösa sig under dagen.

januari 23, 2004

Evolving a Stigmergic Self-Organized Data-Mining

Vitorino Ramos, Ajith Abraham:
Evolving a Stigmergic Self-Organized Data-Mining (PDF).


Self-organizing complex systems typically are comprised of a large number of frequently similar components or events. Through their process, a pattern at the global-level of a system emerges solely from numerous interactions among the lower-level components of the system. Moreover, the rules specifying interactions among the system’s components are executed using only local information, without reference to the global pattern, which, as in many real-world problems is not easily accessible or possible to be found. Stigmergy, a kind of indirect communication and learning by the environment found in social insects is a well know example of self-organization, providing not only vital clues in order to understand how the components can interact to produce a complex pattern, as can pinpoint simple biological non-linear rules and methods to achieve improved artificial intelligent adaptive categorization systems, critical for Data-Mining. On the present work it is our intention to show that a new type of Data-Mining can be designed based on Stigmergic paradigms, taking profit of several natural features of this phenomenon. By hybridizing bio-inspired Swarm Intelligence with Evolutionary Computation we seek for an entire distributed, adaptive, collective and cooperative self-organized Data-Mining. As a real-world / real-time test bed for our proposal, World-Wide-Web Mining will be used. Having that purpose in mind, Web usage Data was collected from the Monash University’s Web site (Australia), with over 7 million hits every week. Results are compared to other recent systems, showing that the system presented is by far promising.

KEYWORDS: Self-organization, Stigmergy, Data-Mining, Linear Genetic Programming, Distributed and Collaborative Filtering.

Läs även Självorganisation och data mining/data analys, samt stigmergy för några av författarnas tidigare arbeten samt länkar om stigmergi.

januari 22, 2004

Tai Chi Chuan/Taijiquan-terminen vt 2004 börjar

Nästa vecka - dvs den som börjar med måndagen 26 januari 2004 - startar vårterminens nybörjarkurser i Tai Chi Chuan (Taijiquan) hos Svenska Tai Chi Chuan Institutet. Om du är nyfiken på Tai Chi Chuan rekommenderar jag att du tittar på nämnda hemsida.

Kurserna i Malmö börjar måndag 26 januari eller onsdag 28 januari, i Lund tisdag 27 januari eller torsdag 29 januari. Plats och mer praktisk information finns i kursprogrammet (välj "Kursprogram" i vänstermenyn och sedan "Terminskurser" för respektive stad.)

Det blir en uppvisning söndagen den 25 januari kl 14.00 på Sorgenfriskolan i Malmö. Från kursprogrammet: Vi visar upp ett tvärsnitt av vår breda repetoar, med Tai Chi och Qi Gong. Där visas också svärd, sabel, partnerövningar och snabba Tai Chi former.
Fri entré. Alla är välkomna!

Själv har jag nu tränat Tai Chi Chuan i 3.5 år, och är således fortfarande nybörjare. Ju mer man lär sig desto mer upptäcker man vad som som är kvar att lära i grunderna, vilket är en nyttig träning i ödmjukhet. Back to Basics.

Se även min Taijiquan-sida samt Tai Chi Chuan/Taijiquan-terminen börjar som innehåller lite mer information (datumen som står är för förra terminen).

januari 21, 2004

Det fungerar att sova på ett problem

Nature-artikeln Sleep boosts lateral thinking vet att berätta att det ligger mycket i påståendet att man ska sova på ett problem.

"Sleep on it" is standard advice to anyone agonizing over a tricky puzzle. A study of mathematical problem-solving has now shown that a good night's rest really does give you a fresh perspective.

The discovery lends credence to the popular maxim that sleep stimulates lateral thinking, says Jan Born of the University of Lübeck, Germany, who led the project.
Born and his colleagues presented subjects with a series of numbers. They gave participants a simple rule with which to generate a second string of numbers from the first, and asked them to deduce the final digit in this sequence. However, they didn't tell them about a hidden shortcut that allowed the final digit to be calculated almost immediately.

Artikeln avslutas med lite sömntips:

A 30-minute 'power nap' would be enough to give workers the benefits of REM sleep, says Ribeiro. Such an allowance could combat stress and boost workplace performance.

"You would expect a power nap to help you be more creative," agrees Born. "But as long as you get around eight hours' sleep at night you should be fine."

(För övrigt har Mats Andersson skrivit om sina erfarenheter av detta.)

Senaste Complexity Digest

Veckans Complexity Digest innehåller bland annat länkar till nedanstående:

Debashish Chowdhury, Katsuhiro Nishinari, Andreas Schadschneider: Self-organized patterns and traffic flow in colonies of organisms: from bacteria and social insects to vertebrates
Flocks of birds and schools of fish are familiar examples of spatial patterns formed by living organisms. In contrast to the patterns on the skins of, say, zebra and giraffe, the patterns of our interest are {\it transient} although different patterns change over different time scales. The aesthetic beauty of these patterns have attracted the attentions of poets and philosophers for centuries. Scientists from various disciplines, however, are in search of common underlying principles that give rise to the transient patterns in colonies of organisms. Such patterns are observed not only in colonies of organisms as simple as single-cell bacteria, as interesting as social insects like ants and termites as well as in colonies of vertebrates as complex as birds and fish but also in human societies. In recent years, particularly over the last one decade, physicists have utilized the conceptual framework as well as the methodological toolbox of statistical mechanics to unravel the mystery of these patterns. In this article we present an overview emphasizing the common trends that rely on theoretical modelling of these systems using the so-called agent-based Lagrangian approach.

NewScientist.com: Puzzled monkeys reveal key language step:
The key cognitive step that allowed humans to become the only animals using language may have been identified, scientists say.

A new study on monkeys found that while they are able to understand basic rules about word patterns, they are not able to follow more complex rules that underpin the crucial next stage of language structure.

NewScientist.com: Disgust is good for you, shows study
The purpose of disgust has been quantitatively demonstrated for the first time - it is an evolved response that protects people from disease or harm.

Senaste R News (3/2003)

Senaste (nr 3/2003, PDF) R News (för statistik- och dataanalyssystemet R) innehåller bland annat följande artiklar:

* R as a Simulation Platform in Ecological Modelling
Intressant artikel som diskuterar olika typer av simuleringar såsom (från rubrikerna): Differential equations, Individual-based models, Individual-based population dynamics, Particle diffusion models, Cellular automata
Se även Thomas Petzoldt's Tutorials, Tools and Downloads. Det finns lite demoprogram här (några är i stort sett identiska med artikelns exempel).

* Dimensional Reduction for Data Mapping

Diskuterar och visar exempel på olika metoder såsom: Principal component analysis, Multi-dimensional scaling, The self organising map, Independent component analysis and projection pursuit,

* Debugging Without (Too Many) Tears

E. Almaas, A.-L. Barabasi: Power laws in biological networks

E. Almaas, A.-L. Barabasi: Power laws in biological networks

The rapidly developing theory of complex networks indicates that real networks are not random, but have a highly robust large-scale architecture, governed by strict organizational principles. Here, we focus on the properties of biological networks, discussing their scale-free and hierarchical features. We illustrate the major network characteristics using examples from the metabolic network of the bacterium Escherichia coli. We also discuss the principles of network utilization, acknowledging that the interactions in a real network have unequal strengths. We study the interplay between topology and reaction fluxes provided by flux-balance analysis. We find that the cellular utilization of the metabolic network is both globally and locally highly inhomogeneous, dominated by "hot-spots", representing connected high-flux pathways.

Findory.com är en personaliserad (se nedan) nyhetssamlare. Man kan, men behöver inte, registrera sig för att det ska fungera, vilket är bra. Det finns en "What have I read?"-lista, där man kan se vilka artiklar man läst. En bra finess är att det går att ta bort artiklar från listan som man inte vill ska vara med i personaliseringen.

Från About:
What is Findory Personalized News?

Findory News is a newspaper built just for you. Other web news sites show the same news to everyone, but not everyone is the same. Findory News shows you articles that you want to see. It adapts to your reading habits and emphasizes news articles from around the world that are most likely to be interesting to you.

Från FAQ:n:
What does "personalized" mean? What is the difference between personalization and customization?

A personalized website adapts to your individual interests, showing you what you want to see. Just by using a site, with no effort on your part, the site should learn what you are like and don't like, and help you find what you want. Personalization is different from customization. With a customized website, the site only changes if you explicitly tell it to. For example, many news sites allow you to say what categories of news you like and how the news page should be organized. That is customization. Personalization is when a news site learns what you want just by paying attention to what you seem to be interested in.

Via Smart Mobs.

januari 20, 2004


Lambda the Ultimate pågår en diskussion om Concept Programming. De flesta i debatten är tämligen kritiska, kanske inte så mycket till principen - som några menar är att slå in öppna dörrar - utan mer till att författaren inte riktigt lyckas förklara vad han menar.

Men visst låter detta bra (från Concept Programming-sajten; emfas i originalet):
Concept programming is initially a very simple idea: Your code should reflect the concepts in your application.
A concept is something from the application environment that matters to your program. A "window" displaying some information may be a concept. Most algorithms are derived from some mathematical concept. A "function" may be a concept. Programming is the art of turning concepts into code.

Se även Slashdot-diskussion från 2002.

januari 18, 2004

Mapping weblog communities

Juan-J. Merelo-Guervos, Beatriz Prieto, Fatima Rateb, Fernando Tricas: Mapping weblog communities.

Websites of a particular class form increasingly complex networks, and new tools are needed to map and understand them. A way of visualizing this complex network is by mapping it. A map highlights which members of the community have similar interests, and reveals the underlying social network. In this paper, we will map a network of websites using Kohonen's self-organizing map (SOM), a neural-net like method generally used for clustering and visualization of complex data sets. The set of websites considered has been the Blogalia weblog hosting site (based at this http URL), a thriving community of around 200 members, created in January 2002. In this paper we show how SOM discovers interesting community features, its relation with other community-discovering algorithms, and the way it highlights the set of communities formed over the network.

Se Blogalia samt BloJJ - Adventures of a multidimensional freak.

Mer om reguljära uttryck (i Perl)

I Maintaining Regular Expressions (perl.com) beskriver Andy Mackey sin Perl-modul Regexp::DeferredExecution.

Modulen beskrivs på följande sätt: This module provides the ability to include embedded Perl code within regular expressions via the usual (?{}) construct, but defer the execution of that code until the end of a successful pattern match.

Andra moduler som refereras i artikeln:

Se även Mackeys artiklarO'Reilly Network.

Three Mistakes in the Moral Mathematics of Blogging

Ahtisaari: Three Mistakes in the Moral Mathematics of Blogging“ A Reply to Clay:

De tre misstagen är:
* Natural Social Institutions
* Links from Nowhere
* Forced Compensation

januari 17, 2004

Splitting Terrorist Cells

Ivars Peterson's MathTrek: Splitting Terrorist Cells

How can you tell if enough members of a terrorist cell have been captured or killed so there's a high probability that the cell can no longer carry out an attack? A mathematical model of terrorist organizations might provide some clues. The question is what sort of mathematical model would work best.

januari 15, 2004

Snopes Urban Legends Reference Pages

Snopes.com Urban Legends Reference Pages har fått RSS-flöden. Flödet What's new rekommenderas, men även Top searches kan vara av intresse.

Via Reflective Reality.

Uppdatering: Se även Mytlänkar hos Skrönor & Myter.

januari 14, 2004

Information Visualisation Magazine

InfoViz.net (Inf@Vis!) är en sajt för informationsvisualisering (Information Visualisation).

Från About-sidan:
InfoVis.net is a project devoted to Information Visualisation, seen as the process of incorporation of knowledge through the perception of information, mainly (but not only) in visual form.

Sometimes it is confused with Information Design. Info Design is part of InfoVis.

* In order to contribute to the definition of this emerging specialty.
* To build a technical and social reference of the same.
* To be used by both the English and Spanish speaking communities. Bilingual! (Note that the English translation is done by the author, so, please, excuse the imperfections).
* To build, in a collaborative way, a "State of the Art" around InfoVis .

Den senaste artikeln är Graphs.

Några tidigare artiklar:
Social Networks
Ambient Visualisation
PowerPoint: anathema or boon?
Visualising Social Interaction

Mapping Cyberspace

Mapping Cyberspace av Martin Dodge och Rob Kitchin:
What Does Cyberspace Look Like?
How Is Cyberspace Changing Social Relations?
Will Cyberspace Make Geography Obsolete?

bok (Amazon), mailinglista.

januari 13, 2004

Senaste SIGKDD (Special Interest Group on Knowledge Discovery and Data Mining) Explorations

SIGKDD (ACM Special Interest Group on Knowledge Discovery and Data Mining) kommer några gånger per år ut med skriften Explorations. Det senaste (Vol 5, Issue 2) är ett temanummer om Microarray Data Mining.

Det finns även andra intressanta papers (samtliga PDF-filer), t.ex.

Tom Fawcett:
In vivo" Spam Filtering: A Challenge Problem for KDD
Spam, also known as Unsolicited Commercial Email (UCE), is the bane of email communication. Many data mining researchers have addressed the problem of detecting spam, generally by treating it as a static text classi cation problem. True in vivo spam ltering has characteristics that make it a rich and challenging domain for data mining. Indeed, real-world datasets with these characteristics are typically di cult to acquire and to share. This paper demonstrates some of these characteristics and argues that researchers should pursue in vivo spam ltering as an accessible domain for investigating them.

Tom Fawcett är en gammal favorit. Se t.ex. Bibliography on Fraud Detection, What does music look like? samt publications.

S. Sarawagi, S. Srinivasan, V. G. Vinod Vydiswaran, K. Bhudhia:
Resolving citations in a paper repository
In this paper, we describe our process of creating a citation graph from a given repository of physics publications in LATEX format. The task involved a series of information extraction, data cleaning, matching and ranking steps. This paper describes the challenges we faced along the way and the issues involved in resolving them.

Shawndra Hill, Foster Provost:
The Myth of the Double-Blind Review? Author Identification Using Only Citations
Prior studies have questioned the degree of anonymity of the double-blind review process for scholarly research articles. For example, one study based on a survey of reviewers concluded that authors often could be identified by reviewers using combination of the author s reference list and the referee s personal background knowledge. For the KDD Cup 2003 competition s Open Task, we examined how well various automatic matching techniques could identify authors within the competition s very large archive of research papers. This paper describes the issues surrounding author identification, how these issues motivated our study, and the results we obtained. The best method, based on discriminative self-citations, identified authors correctly 40-45% of the time. One main motivation for doubleblind review is to eliminate bias in favor of well-known authors. However, identification accuracy for authors with substantial publication history is even better (60% accuracy for the top-10% most prolific authors, 85% for authors with 100 or more prior papers).

januari 11, 2004

Power Laws: Hyper or Revelation?

Kurs: Power Laws: Hype or Revelation?:

From sexual networks to filesharing, genetics to leaders of business organizations, researchers have started to recognize a pervasive characteristic of networks across a variety of disciplines. The term "power law" has come to describe the organizing principle that very few nodes will maintain a large percentage of the links in a network. The ubiquity of power laws has been interpreted as a revelation that touches almost all fields; as a result a large number of papers have been written on this topic in a short period of time. This class aims to review the literature central to the study of power laws and give attention to the question of whether this theory is here to stay.

Innehåller än så länge bara outlines och litteraturlista, men enligt overstated.net så kan det komma lite smått och gott senare. Se även kommentarerna i den nämnda anteckningen.

Mer om 47 och andra (prim)tal

Prime Curios! is an exciting collection of curiosities, wonders and trivia related to prime numbers.. Sajten är en del av The Prime Pages.

Några exempel på Prime Curious (som även täcker sammasatta tal):
47, 52, 99, 77.

Se även Talfördelning på google - varför är det så ont om 52?.

Posted by hakank at 07:16 EM Posted to Matematik

januari 10, 2004

Networking Toolkit: JUNG 1.2 Released

Ny version av Java Universal Network/Graph Framework, JUNG, (version 1.2). Laddas ner härifrån.

Nyheterna i denna version:

Se även JUNG: ett Java-ramverk för graf-/nätverksanalys.

januari 08, 2004

First Monday January 2004

Senaste First Monday innehåller bland annat följande:

Boris Galitsky and Mark Levene: On the economy of Web links: Simulating the exchange process
In the modern Web economy, hyperlinks have already attained monetary value as incoming links to a Web site can increase its visibility on major search engines. Thus links can be viewed as investment instruments that can be the subject of an exchange process. In this study we build a simple model performed by rational agents, whereby links can be bought and sold. Through simulation we achieve consistent economic behaviour of the artificial Web community and provide analysis of its micro– and macro–level parameters. In our simulations we take the link economy to its extreme, where a significant number of links are exchanged, concluding that it will lead to a winner take all situation.

Susan L. Gerhart: Do Web search engines suppress controversy?

Web behavior depends upon three interlocking communities: (1) authors whose Web pages link to other pages; (2) search engines indexing and ranking those pages; and (3) information seekers whose queries and surfing reward authors and support search engines. Systematic suppression of controversial topics would indicate a flaw in the Web’s ideology of openness and informativeness. This paper explores search engines’ bias by asking: Is a specific well–known controversy revealed in a simple search? Experimental topics include: distance learning, Albert Einstein, St. John’s Wort, female astronauts, and Belize. The experiments suggest simple queries tend to overly present the "sunny side" of these topics, with minimal controversy. A more "Objective Web" is analyzed where: (a) Web page authors adopt research citation practices; (b) search engines balance organizational and analytic content; and, (c) searchers practice more wary multi–searching.

januari 07, 2004

Perfekt kakdelning

Cake-cutting perfected (Nature):

Attempting to share out a cake can easily provoke feelings of injustice. But now a team of mathematicians claims to have found a perfectly fair cake-cutting procedure.
Political scientist Steven Brams of New York University and his mathematician and economist colleagues say that apportioning is 'perfect' only if it is efficient, equitable and envy-free. 'Efficient' means that the allocation cannot be made better for any one party while remaining at least as good for all the others. 'Equitable' means that every party values the portion it receives as much as every other party values theirs. And 'envy-free' means that each party thinks it receives the best part, or at least one of several equally good portions.
This cake-cutting method can only be made 'perfect' for two or three parties; the researchers have not been able to find such a solution for four. Most disputes over goods or property involve only two or three parties, they point out. Although for cake, they admit, it may be another matter.

Papret som refereras är
Brams, S. J., Jones, M. A. & Klamler, C.: Perfect cake-cutting procedures with money, Preprint, submitted to American Mathematical Monthly (2003).

Se även
Steve Brams
Cake Cutting (MathWorld).

Musik och komplexitet

Techno hits basic beat (Nature):

An obscure form of music known as Javanese Gamelan has won the top prize for musical complexity, according to a novel kind of musical analysis.
The method produces a number, denoted alpha that quantifies the complexity of patterns in a signal - in this case, the volume of music. A low alpha (less than 1) indicates relatively non-complex music, whereas more complex musical signals have a value of alpha equal to 1. When alpha is much higher than 1, the patterns are so complex that it sounds more like noise than music.

Gamelan has average values of alpha closest to 1, as does what the researchers characterize as 'new age music'. The averages for Western classical and Hindustani music are slightly higher.

Curiously, jazz and rock and roll have virtually identical average alpha values of about 0.9, challenging the notion that the latter is in some ways a debased, simplified version of the former. But then, in music, rhythm isn't everything.

Heather D. Jennings, Plamen Ch. Ivanov, A. M. Martins, P. C. da Silva, G. M. Viswanathan: Variance fluctuations in nonstationary time series: a comparative study of music genres.

An important problem in physics concerns the analysis of audio time series generated by transduced acoustic phenomena. Here, we develop a new method to quantify the scaling properties of the local variance of nonstationary time series. We apply this technique to analyze audio signals obtained from selected genres of music. We find quantitative differences in the correlation properties of high art music, popular music, and dance music. We discuss the relevance of these objective findings in relation to the subjective experience of music.

Posted by hakank at 10:07 FM Posted to Komplexitet/emergens

januari 06, 2004

John F. Sowa

John F. Sowa har några intressanta sidor.

Conceptual Graphs
Kompanjonssajten till boken Knowledge Representation: Logical, Philosophical, and Computational Foundations (Amazon-länk)

Lite annat om ontologier:
Raul Corazzon Descriptive and Formal Ontology

Posted by hakank at 09:22 FM Posted to

januari 05, 2004

Eurosport: "Fight Club"

För den som till skillnad från Chadie, Erik och mig inte är så intresserad av Kommissarie Lynley i kväll (SVT 1, 22.15), men däremot är intresserad av kampsport kan jag rekommedera ett kik på Eurosport klockan 22.00. Då visas nämligen det nyligen startade kampsportsprogrammet Fight club [Nej, jag tyckte inte om filmen med detta namn.].

En puff för första (förra) avsnittet av programmet:
Måndagen den 22 december är det dags för tidig julklappsutdelning för alla kampsportfans. Då lanserar Eurosport det nya magasinprogrammet Fight Club. Fight Club kommer att sändas varannan vecka och innehåller det bästa från kampsportsvärlden som thaiboxning, karate och kickboxning. Programmet kommer att innehålla både matcher, nyheter och reportage.

Premiären kunde inte bli bättre då den innehåller den för Europa exklusiva sändningen från K1 World Grand Prix finalen som avgörs på . Åtta finalister gör upp om vem som är bäst i världen inför 70 000 åskådare på plats i Tokyo, Japan. Svenske Martin Holm är reserv i finalen och kan få vara med och kämpa om de 4 miljoner kronor som går till segraren.

Programmets innehåll idag (enligt dagens tvprogram.nu):
kvällens Fight Club sätter vi fokus på "Super Fight" matcherna i den stora K-1 finalen som hölls i början av december förra året. Bland mathcerna fanns bland annat den mellan svensken Martin Holm och sydafrikanen Jan "the Giant" Nortje. Dessutom innehåller programmet ett porträtt av holländaren Remy Bonjasky som vann K-1 World GP 2003. Dessutom senaste nytt från kampsportvärlden.

Av en händelse råkade jag se flera av de K 1-program som Eurosport visade innan jul och blev rätt fascinerad av sporten, och speciellt imponerad av Remy Bonjasky, Cyril Abidi samt Alexey Ignashov.

För mer om K-1 se t.ex.
K1 Official Website
K-1 Scandinavia

Från New York Times When Sand Dunes Collide, Sometimes They Mate and Multiply:
Veit Schwämmle, a physicist, conducted the research with a colleague at the University of Stuttgart using a computer program that predicted what would happen when one of the crescent-shaped dunes called barchans (pronounced bar-KAHNS) wandered into another.

Veit Schwaemmle, hans Dunes-sida samt thesis Modeling of Dune Morphology (PDF).

Hans Herrmann har även forskat om Dunes.

Tidigare blogganteckningar om sand:
Simulering av sand
... Nu även med lite granularitetsforskning.

Korsord och AI

I artikeln Puzzles provide brain insight skrivs om forskning kring korsordslösande. CogNews-artikeln Crosswords Test AI frågar kort om detta är nästa stora utmaning för AI.

As early as 1991, research showed that letters and meanings combined provide a better set of cues for memory retrieval than either one alone. This matches our own impression that we rely on the syllable fragments in a partially-complete crossword as much as we rely on the list of definitions. Functional MRI scans show that multiple brain areas are involved in responding to these cues.

Artificial intelligence tries to duplicate or exceed human brain processing by means of a computer.

Solving crosswords has been a test of artificial-intelligence programs since 1977. Recently, researchers wrote a program to solve a crossword based on its clues as well as its diagram structure.

Researchers at Duke created a program called "Proverb" for "probabilistic cruciverbalist." A cruciverbalist is a crossword-puzzle solver, and probabilistic refers to using a computer to calculate how probable or likely a given answer is among many choices.

Några länkar:
Michael L. Littman
Constraint Satisfaction, Probability, and Solving Crossword Puzzles (om Proverb)
Solving Crossword Puzzles as Probabilistic Constraint Satisfaction
Några fler av Littmans papers finns här.

Se även:
Crossword Puzzle Software, Tools, Articles, etc
OK då: Här är mitt eget enkla verktyg för kortsordslösande Cross words som inte använder AI överhuvudtaget, men däremot finns både för svenska och engelska.

"jag" i bloggen

I kommentaren till 200 dagar påpekar Mats Andersson mycket riktigt min rikliga användning av ordet "jag": det är det fjärde vanligaste ordet.

Eftersom jag inte riktigt förstår det själv har jag nu gjort en undersökning hur jag hittills använt ordet "jag", dvs vilka ord jag har skrivit före och efter ordet "jag" när jag skrivit mina blogganteckningar, då jag - till skillnad från denna anteckning - inte tänkte på hur jag använde ordet "jag".

[Föregående mening innehåller 10 stycken "jag", men den är å andra sidan speciellt konstruerad för ändamålet. En alternativ formulering av meningen utan något "jag" skulle kunna vara:

"Eftersom detta fenomen för närvarande inte är helt förklarat, har det sålunda, i syfte att klargöra ifrågavarande fenomen, gjorts en detaljerad undersökning, medelst bland annat s.k. datorprogrammering samt därefter en djupt penetrerande statistisk analys av förevarande ords användsfrekvenser, lämpligt nog och underlättande för analysen, varande sorterade i frekvensordning, i.e. i vilken kontext det använts i de hittillsvarande sammanhang då det existerat, utan därför erforderligt beslut, en minimal medvetenhet om att ordförekomsten erfordrades vara minimerad alternativt vara maximerad."

Tja, välj själv. :-)]

Det finns 324 olika tvåordsfraser med "jag". Så här ser de vanligaste konstrukterna ut:

har jag: 35
jag har: 27
att jag: 21
som jag: 19
jag inte: 19
när jag: 16
jag är: 10
eftersom jag: 9
jag läste: 8
om jag: 7
är jag: 7
men jag: 6
vad jag: 5
jag i: 4
jag nu: 4
jag kan: 4
och jag: 4
jag skriver: 4
jag på: 4
läste jag: 4

Exempel på användandet av frasen "har jag" kan ses via google: site:hakank.org "har jag"

Det finns 886 olika treordsfraser med "jag". De vanligaste är:

har jag inte: 5
som jag skrev: 3
när jag läste: 3
nu har jag: 3
sedan har jag: 2
jag kollat in: 2
jag inte sett: 2
jag är en: 2
jag hade tänkt: 2
som jag inte: 2
jag just nu: 2
jag inte fått: 2
var jag på: 2
har jag varit: 2
jag har ännu: 2
jag är inte: 2
jag skrev i: 2
jag har inte: 2
har jag skapat: 2
skrev jag lite: 2
eftersom jag är: 2
jag har haft: 2
jag stött på: 2
tyvärr har jag: 2
jag letar efter: 2
månader har jag: 2
till att jag: 2
jag inte har: 2
jag har nu: 2
har jag endast: 2
trots att jag: 2
jag dock inte: 2
på att jag: 2
som jag har: 2
som jag dock: 2
vad jag har: 2
jag läste en: 2
att jag inte: 2
sedan jag började: 2
jag på ett: 2
jag läst om: 2
år har jag: 2
jag mig för: 2
tidigare har jag: 2
jag tänker på: 2
menade jag slumpmässig: 1

"menade jag slumpmässigt" är för övrigt en favorit.

januari 04, 2004

200 dagar

I dag är det 200 dagar sedan hakank.blogg skapades.

Lite statistik så här långt:
379 anteckningar, 343 kommentarer, dvs cirka 0.9 kommentarer per anteckning. Cirka 73000 ord och 470000 tecken (exklusive kommentarer men inklusive citat och exklusive HTML-kod).

De vanligaste orden samt dess frekvens är:

att: 362
det: 353
i: 337
jag: 317
en: 316
the: 307
är: 292
och: 292
som: 265
av: 244
på: 223
om: 206
för: 184
of: 177
and: 175
har: 153
in: 130
a: 130
med: 129
inte: 125
till: 120
to: 113
den: 111
ett: 110
man: 107
de: 102
that: 82
is: 77
finns: 74

Man kan notera att det är rätt mycket engelska texter. Och hur var det där med att skriva "jag" på sin blogg? Skulle man göra det eller inte? :-)

Kategorisk perception

Jag läser nu boken "Hur Homo blev sapiens - Om tänkandets evolution" (länk till den engelska versionen av boken "How Homo Became Sapiens - On The Evolution of Thinking") skriven av Peter Gärdenfors, professor i kognitionsforskning (cognitive science).

Boken var en rekommendation jag fick efter anteckningen Vår besatthet att hitta mönster i tillvaron som bland annat efterfrågade litteratur kring den evolutionära fördelen att vi är benägna att se mönster i tillvaron. Jag är fortfarande tacksam för fler tips om detta. Maila mig gärna.

På sidan 40, avsnittet "2.4 Kategorisk perception: att sortera världen i lådor", står:

Vi har begåvats med hjärnor som fyller i ofullständiga mönster därför att sådana mekanismer ökar våra överlevnadschanser. En del av de mekanismer som söker efter mönster är genetiskt givna. Andra är inlärda (även om vi inte är medvetna om det). Det finns ett fenomen som inom den kognitiva psykologin kallas kategorisk perception. Det innabär att en verklighet där det inte finns några skarpa gränser sorteras upp i distinkta fack av våra perceptuella mekanismer. När perceptionen skapas lägger vår hjärna till gränser som inte har någon verklig motsvarighet. Gränserna ges av ett system av kategorier som vanligen är en produkt av inlärning.

Gärdenfors nämner sedan psykologen Robert Thouless studie "Phenomenal regression to the real object" (1931):

Han placerade en rund skiva på bordet som försökspersoner fick se ur olika vinklar. Vad de såg var mer eller mindre ellipsformat. Sedan fick de bekriva hur skivan såg ut från deras synvinkel, antingen genom att rita av den eller genom att matcha den mot olika ellipsformer som försöksledaren tillhandahöll. Försökspersonerna beskrev genomgående sin perception av skivan som rundare än hur de egentligen såg den, dvs som rundare än den bild som föll på näthinnan. Deras kunskap att objektet egentligen är en rund skiva påverkade alltså perceptionen av den. Det vi tror att vi ser är inte alltid det vi ser. Samma typ av effekter dyker upp, fast ännu mer utpräglatm när det gäller våra minnen.

Gärdenfors nämner två andra exempel på kategorisk perception:
- urskilja mellan de tre fonemen "ba", "da" och "ga". Se t.ex. Kategorisk perception (Uppdatering av länken. Tack, Anna A.) som innehåller ett litet experiment (en Java Applet).
- urskilja toner som genereras av en tongenerator (glidande skala). Vi som är vana vid vänsterländsk tolvtonsskala har svårt att urskilja de 21 olika tonerna i indisk musikskala. Detta är ett exempel på kulturell betingning av kategorierna.

Jag blev nyfiken på kategorisk perception och gjorde lite googleresearch. Här är några av de saker jag hittade.

Stevan Harnad har skrivit mycket om detta:

Psychophysical and cognitive aspects of categorical perception:
A critical overview.

Bok: Categorical Perception : The Groundwork of Cognition
Advanced Topics: Categorical Perception (CP) (där det även finns lite referenser till "Whorf Hypothesis")
Categorical Perception: Bibliography (med abstracts).

Andra referenser:
Different shades of perception A new study shows how learning--and possibly language--can influence color perception.
En rätt nylig diskussion på bloggen semantics etc.: Color Cognition and Language som bland annat refererar till New York Times-artikeln Color Cognition.

januari 03, 2004

Förslag på lösning av julpyssel

I God Jul! Och ett litet julpyssel presenterades ett litet julpyssel: Stora virtuella guldstjärnor utgår till den som kan skapa en fullständig (och på något sätt förståelig) mening av samtliga och endast orden i [nedanstående] lista:

du, duo, glo, go, god, gud, gul, guld, jo, jod, judo, jul, ljud, ljug, lo, lod, loj, oj, oljud, uj

Mats Andersson har uppenbarligen gjort några försökt, men kom inte på något godtagbart förslag.

Här är ett förslag på pysslet som använder en teknik som inte uttryckligen förbjöds enligt reglerna:

Låt oss göra följande översättningslista:

du: G
duo: O
glo: D
go: " "
god: J
gud: U
gul: L
guld: " "
jo: G
jod: O
judo: T
jul: T
ljud: " "
ljug: N
lo: Y
lod: T
loj: T
oj: " "
oljud: Å
uj: R

Meningen du duo glo go god gud gul guld jo jod judo jul ljud ljug lo lod loj oj oljud uj blir således "God Jul Gott Nytt År".

Fler förslag som i övrigt är godkända och inte använder denna teknik?

Filmklassiker med synopsis (filmsite.org)

Filmsajten filmsite.org innehåller mycket information om (främst amerikanska) filmer. En feature som jag uppskattar är de 200 bästa filmerna med långa synopsis och klassiska dialoger:

Några av mina favoritfilmer:
All about Eve
Annie Hall
Blade Runner
Duck Soup
Godfather, Part II
It's a Wonderful Life
Mr. Smith Goes To Washington
The Philadelphia Story
Star Wars.

Via Language Log, där det även finns en länk till Dinner for One, dvs "Same procedure as every year, James...".

januari 02, 2004

Teknisk/teknologisk determinism

Hittade zephorias kommentar technological determinism... on being read and labeled out of context till Technological Determinism.

zephoria skriver bland annat:
From where i stand, there are some amazing tools for social scientists to use to study technology, but rarely are they used to help create technology. This is foolish. Technology creators are not idiots. Their work is certainly affected by the social environment. Yet, their creations also do affect the social culture. It is a bi-directional, non-deterministic process. Unfortunately, i feel as though too many science studies folks just wait to see what will be created before studying it, rather than helping the creators think through the environment in which they are creating.

Att kolla in mer vid tillfälle:
Technological or Media Determinism
Computer-Mediated Communication Magazine (Special focus on technological determinism)
Social constructionism vs. technological determinism (blogg att kolla på: infosophy: socio-technological rendering of information)

"technological determinism"
("teknisk determinism" OR "teknologisk determinism")

Två Nature-artiklar

Secrets of stone skimming revealed:

Want to skim the perfect stone? A team of French researchers have worked out how, using their very own stone-skipping machine.
To achieve the maximum number of rebounds, the angle between a spinning stone and the water should be about 20 degrees1, advises [Christophe] Clanet: "This is the magic angle."

Se även
The physics of stone skipping (PDF) av Lydéric Bocquet.
Kasta smörgås (tyvärr är den refererade Discoverartikeln inte tillgänglig längre).

Songbird duets resonate to beat

The synchronized rhythms of South American ovenbirds may be driven by simple physics, say researchers, rather than deep-rooted musical talent.
The male's song 'drives' the pattern of the female song, the researchers think, rather like a pendulum that is set swinging by vibration of the beam from which it hangs. But the songs differ from a simple pendulum, or linear oscillator, that swings with a single, steady rhythm.
In theory, a typical sequence might go from perfectly synchronised notes of 1:1 to 2:3, 1:2, 2:5, 1:3, and so on all the way to 1:5. This is just what seems to happen in the real duets as the male speeds up his song.

Se även Deconstructing Birdsong

januari 01, 2004

DN/Temo-undersökning: Vad förväntar sig svenskarna av år 2004?

Under rubriken Svenskar tror på bättre kärleksliv 2004 presenterasTemo-undersökningen "Vad förväntar sig svenskarna av år 2004?" (finns att ladda ner som PDF-fil).

Nästan varannan svensk befarar med [sic!] att Sverige blir ett sämre land att leva och växa upp i nästa år. Däremot tror de flesta av oss att kärlekslivet och till en viss del även privatekonomin blir bättre 2004. Det visar en stor undersökning om det svenska folkets förväntningar på 2004 som Temo gjort på uppdrag av Dagens Nyheter.

När det gäller sådana förändringar så vet man ju inte hur bra eller dåligt de tillfrågade tyckte det var tidigare. Så, för att ta rubrikfrågan: Var kärlekslivet så dåligt förra året att all förändring är till det bättre, eller var det riktigt bra och man tror det ska bli ännu bättre, eller något mittemellan?

Det är tråkigt att så många anser att många saker blir sämre nästa år, t.ex. att Sverige blir ett sämre land att leva i, det blir fler terrorattacker och ökad sjukskrivning. Är de pessimister eller realister?

För lite TrackBackande?

Joakim Hertze (blog.hertze) tycker att det är för lite TrackBackande. Jag är benägen att hålla med.

Formen för detta kan kanske diskuteras (gällde iofs one-liner-TrackBacks).

En av de stora fördelarna med TrackBack är att de, i vissa bloggsystem, görs automatiskt. Tyvärr gjordes inte det mot Joakims blogg, vilket upptäcktes helt empiriskt. Nu testar jag manuellt från Movable Type.
[... time passes ...] Nix, det funkar inte heller.

Däremot funkar det att använda formuläret.

God Fortsättning!

Det blir inget nyårslöfte inför det nya året, inte ens något blogglöfte. Jag lovar.

Däremot blir det säkerligen andra löften, såsom
(ju(l|n)|a*((ugust|(jan|febr)uar)i|pril)|ma(j|rs)| (septem|okto|(nov|dec)em)ber)-löften.

