Apache Cassandra blir i minnet alternativet med Datastax Enterprise 4.0

Medan tekniken för att köra stora-data projekt kan öppna upp för fler företag har framsteg hämmats av bristande kompetens och ett företags preferens för magkänsla.

Datastax har lagt en in-memory computing funktion i den senaste versionen av sin Apache Cassandra-baserade NoSQL databas, som en del av en enhet för att öka prestandan hos online-applikationer.

Liksom alternativet i minnet, den nyligen släppt Datastax Enterprise 4.0 inkluderar förbättrad sökning, en uppdaterad version av OpsCenter visuell övervakning verktyg, och certifierad, Cassandra 2,0.

“Fokus i denna release och några av de andra som är kommande är på prestanda. In-minne alternativ leder denna avgift”, säger Datastax produkter VP Robin Schumacher.

Det ger all godhet Cassandra – det vill säga den flexibla datamodellen, multi datacenter stöd, linjär scaleout – till en in-memory databas.

Anledningen till att vi gör detta är i branschen finns det en stor tonvikt på prestanda och hastighet, särskilt i online web detaljhandeln och verkligen alla e-handelsföretag.

Den Datastax Enterprise big-dataplattform, som används av företag som eBay och Netflix, består av analys, sök- och hanteringsverktyg och stöd på toppen av en certifierad version av Apache Cassandra distribuerad databas.

Med version 4.0, mindre ofta refererade data kan tilldelas traditionella roterande skiva, med solid-state lagring används för snabbare läs-svarstider, och i minnet alternativ reserverad för de hetaste data.

Kritiska steg för framgångsrik SMB stor uppgifter strategi, forskning: Big Data trender – Kostnader, satsningar, utfall, bemanning, Hadoop framträder som kärnan ramen för stora uppgifter, Big Data Primer för IT-proffs

“Det är helt transparent för ansökan och utvecklare. De behöver inte göra något särskilt för att utnyttja in-memory objekt”, sade Schumacher.

När du skapar vad som finns i Cassandra bara en normal databastabell, kan du tilldela den via en av parametrarna i definitionen av tabellen att vara i minnet. När du träffar in, kommer det att se, känna, agera och smakar precis som alla andra Cassandra bord.

Du laddar data till det, massage data, frågedata från det, och det fungerar precis som en vanlig Cassandra bord. Det vågar ut över flera noder, det är tillgängligt för flera datacenter stöd. Det finns inget nytt att en utvecklare eller ett program måste ändras för att referera dessa objekt.

När tabellen har skapats, kommer det automatiskt att distribueras på några nya noder läggs till klustret för kapacitet och skala.

Effekterna av BYOD och molntjänster på ERP, Forskning: IT-ledare avslöjar missar, aktuella trender och framtida affärssystem, Microsoft Enterprise primer på Windows Azure nätverk, kostnadsfördelning toolkit: Google Apps vs. Office 365

IBM att förvärva Cloudant, Red Hat och Hortonworks avslöja Hadoop stora datasamarbete, SkySQL verktyg syftar till att lindra Galera kluster för mariadb och MySQL, Apache Foundation och Linux Foundation går samman för ApacheCon, Cassandra 2,0: Nästa generation av stora datamängder, Lies, förbannat lögner och stora uppgifter: hur företag får analytics fel – och hur man får det rätt, Marklogic pekar upp sin Hadoop big-data framtiden, stora nyheter dag för Big Data som Strata konferensen drar igång, MongoDB landar $ 150 miljoner Mål för stora uppgifter, NoSQL uthållighet

Enligt Schumacher, prestandatester som utförs av Datastax på i minnet funktion visar betydande förbättringar i hastighet.

“Vi har sett allt från en generell 10 till 100 gånger mer effektivt lästa frågor när i-minne tabeller används”, sade han.

I de fall där man har starkt minne utmattning – sidan cache på ett Linux-system är helt utmattad – kan du se upp till 1000 gånger mer effektivt i vissa av de tester vi har kört.

Finans, e-handel, telekom, hälsovård och online annonssystem är de områden som sannolikt kommer att dra nytta av in-memory computing.

“När du behöver mycket snabbt läsa-svarstider, oavsett om det är användarprofil uppslag eller produktsökningar som är halvstatiskt, kan de lämpar sig för fall i-minnesanvändning,” sade Schumacher.

Adobe använder Datastax Enterprise för sin marknadsföring Cloud, som servicenivåavtal som fastställer 95 procent av ansökningarna måste fylla på mindre än 12 millisekunder har.

“Den här typen av efterfrågan verkligen skjuter i minnet i förgrunden”, sade han.

Datastax har också genomfört kvalitetsarbete på Cassandra 2,0, som ingår i Datastax Enterprise 4.0, för att certifiera den för produktionsmiljöer.

“Med öppen källkod utveckling, är den metod som frigör tidigt släpper ofta. Det finns egentligen ingen formell testning av koden, eftersom öppen källkod säger:” Min användargrupp kommer att testa denna kod för mig och se till att den fungerar “,” sade Schumacher .

Det kan vara bra för öppen källkod och för vissa open-source projekt. Men om du pratar om något du vill ha förtroende för när du sätter den i produktion, vilket är krigsvana och kommer att stå upp under produktions arbetsbelastning, det är vad vår certifieringsprocess levererar.

Om vi ​​hittar problem i öppen källkod Cassandra, vi gör korrigeringar själva i vår Datastax Enterprise-versionen och sedan ger vi dessa korrigeringar tillbaka till öppen källkod. Men när de går in, det beror egentligen på öppen källkod.

Socialt företagande, Linkedin avslöjar sin nya blogging plattform, stora datamängder, är detta en ålder av Big OLAP,? Big Data Analytics, DataRobot syftar till att automatisera lågt hängande frukt uppgifter vetenskap, stora datamängder, MapR grundare John Schroeder steg ner, COO för att ersätta

Mer om öppen källkod och databaser

Cassandra 2,0 ger ett antal nya utvecklare funktioner såsom lätta transaktioner, liksom förbättringar av Cassandra Query Language, vars likhet med SQL gör det relativt enkelt för utvecklare att flytta från relationsdatabasen världen, sade Schumacher.

Datastax Enterprise 4.0 innehåller också förbättringar av företags sökfunktionen för att ge snabbare kommunikation mellan noder i ett kluster för snabbare lookup gånger och sökoperationer, även med tusentals samtidiga användare.

Ett antal avtal mellan Datastax och företag som Google och Accenture kan berätta för tillväxten av öppen källkod Apache Cassandra distribuerad databas.

“Vi använder Apache Solr för företagssökningar på Cassandra uppgifter och vi har certifierat en ny version av Solr som ger ett antal nya utvecklare funktioner till bordet”, sade han.

Datastax har uppdaterat sin webbaserade OpsCenter visuell förvaltning och övervakningssystem för Cassandra och Datastax Enterprise, vilket ger en instrumentpanel för kluster i molnet och på premissen.

OpsCenter 4,1 s kapacitetsplanering funktionen samlar in information om status för servrar och databasen för att utföra trendanalyser. Administratörer kan nu se när och varför systemen är på deras mest trafikerade och förutse arbetsbelastning.

“Du kan säga saker som,” Baserat på den historia som jag ser här, då är min databas kluster kommer att slå 20 TB eller när är denna server kommer att köra slut på diskutrymme? “,” Sade Schumacher.

Skräddarsy tidsramar tillåter användare att gå tillbaka till någon tidsperiod, prognoser flera statistik samtidigt.

“Så du kan bestämma, till exempel, vilken tabell växer snabbast och kommer att växa snabbast. Det hjälper verkligen pro-aktivt planera för kapacitets medan innan det var verkligen en gissningslek”, sade han.

Eftersom vi har lagt det i minnet alternativ nu Datastax Enterprise 4.0 kan OpsCenter övervakning av dessa i minnet tabeller och varna dig om de blir för stor.

Det är också bättre drill-down. Så om en viss nod börjar visa några dåliga resultat visuellt genom verktyget, kan du bläddra ner och ta reda på exakt vad som händer.

Linkedin avslöjar sin nya blogging plattform

Är detta en ålder av Big OLAP?

DataRobot syftar till att automatisera lågt hängande frukt uppgifter vetenskap

MapR grundare John Schroeder steg ner, COO för att ersätta