- Erik.dv
- Medlem ●
- Stockholm
Vi har haft enorma problem med vår server på jobbet, till och från. Den körde OSX 10.2 Server under större delen av förra året, i december gick vi över till 10.3 server. Maskinen var en MDD G4/867 Mhz. I genomsnitt från övergången till 10.3 Server så har den haft en uptime på c:a 100 timmar - inte bra alls enligt mitt tycke.
Vår ÅF har varit hjälpsam och försökt lösa problemet. I februari gick vi över till en ny G5:a för att se om det ev. var fel på G4:ans hårdvara. Till en början rullade den bra - typ 3 veckor i streck… Men nu har "skiten" med krasher, kernelpanics osv kommit tillbaka.
ÅF:ens förslag nu är att ev. titta på en Win2k3 server istället. De påstår att OSX 10.3 Server inte rullar helt smärtfritt hos flera kunder.
Vi kör inget extremt på servern. Den har rel. låg nätverkstrafik och så. C:a 5 samtidiga användare med lite fildelning, filemaker och mail.
Servern kör:
- FILESHARE (SMB + AFP)
- MAIL
- WEB
- DNS
- DHCP
- FILEMAKER
- PORTFOLIO
- RETROSPECT
Det blir dyrt att gå över till Windows. Men som det är nu så funkar knappt servern. Jag har lite halv-koll på hela serverbiten, men vi förlitar oss mest på vår ÅF där.
Är OSX 10.3 Server så pass mycket mer instabil än OSX Client? Är läget så, om man ska dra det hårt, illa, att behöva gå till Win2k3 Server för att få fungerande nättjänster?
Jag kör lixom dagligen på 4 andra OSX Client maskiner och de rullar på hur bra som helst… En av dem har kört på i 65 dagar utan så mycket som ett nys av hicka.
Jag kör alla de uppräknade funktionerna på Panther Server och jag bootade om igår för att uppgradera, då hade den snurrat i 43 dagar utan ett enda driftstopp. Panther server är utan tvekan ett alldeles exemplariskt server OS även om Apple har en hel del kvar att jobba på, tex. FTP servern och även bygga in fler administrationsmöjligheter i Server Admin / Workgroup Manager. Jag kör Panther Server på en Quicksilver 867Mhz och den har fungerat helt perfekt sedan inköpet i November i fjol.
Du får ursäkta men det verkar som er ÅF inte har riktigt koll på läget.
Edit: jag kör inte portfolio och filemaker.
Under OSX 10.2 så funkade maskinen "okej" dock betedde den sig jäkligt konstigt i vissa fall. Omstarter kunde ta 10 minuter ibland.
Du får ursäkta men det verkar som er ÅF inte har riktigt koll på läget.
Det är det jag börjat tro mer och mer... Det är lite jobbigt att byta ÅF/Service ställe, men man kanske får gå så långt…
Att OSX Server har vissa "shortcomings" i GUI och funktionalitet kan jag leva med, det är dessa eviga krascher som ger enormt merjobb för mig. Det orsakar även huvudvärk för alla på jobbet.
Finns det någon ÅF i stockholm som har stenkoll på 10.3 Server?
Jag skulle tro att det är något av tilläggsprogrammen (Retrospect etc.) som ger dig problem. Jag skulle föreslå att du testar med att lägga över dessa på en annan maskin. de behöver ju inte köra på server versionen utan klienten duger gott. Om sedan serverversionen tuggar på men inte klienten är det bara att flytta över dem en och en.
Dessutom bör du kontrollera de diverse logfilerna för att få information om vad som händer.
Jo, vi bytte som sagt burk helt för att testa. Där har vi bytt minne en gång också….Installationen av maskinen, en G5:a, gjordes genom att klona gamla serverns HD. Kanske det kan leda till problem?
Mängden kernelpanics vi har nu är extrema o jag skulle tippa på att det beror på SCSI-kortet… Alt. minnena. Retrospect 6 Servern är ju minst sagt lite konstig. Den drar ju 100% CPU så fort den kör BackUp.
En kund har en MDD (1GHz Uni) och Mac OS X Server 10.2 (8) som hänger sig benhårt med kernel panic cirka en gång i veckan. Mycket irriterande både för oss och kunden.
Samtliga delar är nu bytta i burken, tom själva burken, trots att den inte har indikerat fel någonstans i hårdvara.
Vanligtvis får man "zalloc" eller "vm_page_insert"-fel i panicloggen.
För övrigt fungerar Mac OS X Server fint på andra burkar är MDD:n så det lutar åt att något är skumt med den generationens Mac:ar.
Okej, mjo, vi får lite grejer i loggarna. Absolut. I regel, nu senaste veckan, så har alla tjänster dött sen ere bara att starata om hela skrället så funkar det.
Det låter som om vi har ungefär samma "dilemma" som er kund Schuckert… Vi hade stora problem Nov > Feb med en genomsnittlig update på 100 timmar. Risigt. Vi bytte då till en helt ny maskin - G5. Allt rullade fint i flera veckor, men nu har verkligen maskinen ballat ur. Nu känns det mer som hårdvarufel än mjukvarufel… Irriterande är ju att jag inte själv har sådan superkoll på hela serverbiten och ÅF:en börjar nu pusha för en Win2k3 server istället.
Vissa program visar efter ett tag "grafiska buggar"….Typ linjer och annat här och där. Det är det som får mig tro hårdvarufel. Det lustiga i sammanhanget är att det inte är server-program som får detta, utan andra program….Typ Mail.app och Safari…
Vissa program visar efter ett tag "grafiska buggar"….Typ linjer och annat här och där. Det är det som får mig tro hårdvarufel. Det lustiga i sammanhanget är att det inte är server-program som får detta, utan andra program….Typ Mail.app och Safari…
Låter som ett typiskt defekt grafikkort (men behöver inte heller vara det).
Från WatchDog
2004-04-19 12:04:23 CEST Terminating due to signal.
2004-04-19 12:04:23 CEST Automatic reboot timer disabled.
2004-04-19 12:04:23 CEST Reaped child process 319 ("/usr/libexec/postfix/master"); quit due to signal 15.
2004-04-19 12:04:23 CEST Reaped child process 320 ("/usr/bin/cyrus/bin/master"); quit with exit status 0.
2004-04-19 12:04:25 CEST Reaped child process 309 ("/usr/sbin/PasswordService"); quit with exit status 0.
2004-04-19 12:04:29 CEST Waiting for KILLed child (pid 310)
2004-04-19 12:04:29 CEST Reaped child process 310 ("/usr/sbin/PrintServiceMonitor"); quit due to signal 9.
#End-Date: 2004-04-19 12:04:29 CEST
#Start-Date: 2004-04-19 12:05:23 CEST
#Fields: date time s-comment
2004-04-19 12:05:23 CEST Started child "/usr/sbin/PasswordService" as pid 339.
2004-04-19 12:05:23 CEST Started child "/usr/sbin/PrintServiceMonitor" as pid 340.
2004-04-19 12:05:23 CEST Started child "/usr/libexec/postfix/master" as pid 341.
2004-04-19 12:05:23 CEST Started child "/usr/bin/cyrus/bin/master" as pid 342.
2004-04-19 12:05:23 CEST Automatic reboot timer enabled.
I System loggen står det MYCKET "auxpropfunc error -1" vad det ny betyder, även "ACK sent <no hostname> 192.168.111.xx pktsize 300".
Fick starta om maskinen manuellt idag vid 12-tiden så. Hittar inget direkt systemloggen, innan maskinen dog så var det som sagt först en användare som inte fick något IP tilldelat sig. Sedan kunde inte jag komma in i system admin och sedan kom en massa grafiska buggar….Jag starta om *skiten*.
Saker som "Sticker ut":
Apr 19 11:30:05 resourceserver xinetd[359]: START: bootps pid=13262 from=0.0.0.0
Apr 19 11:30:05 resourceserver bootpd[13262]: interface en0: ip 192.168.111.254 mask 255.255.255.0
Apr 19 11:30:05 resourceserver bootpd[13262]: server name resourceserver
Apr 19 11:30:05 resourceserver bootpd[13262]: DHCP DISCOVER [en0]: 1,0:30:65:b:78:f3
Apr 19 11:30:05 resourceserver bootpd[13262]: server name resourceserver
Apr 19 11:30:05 resourceserver bootpd[13262]: DHCP DISCOVER [en0]: 1,0:30:65:b:78:f3
Apr 19 11:30:05 resourceserver bootpd[13262]: OFFER sent <no hostname> 192.168.111.75 pktsize 300
Apr 19 11:30:07 resourceserver bootpd[13262]: DHCP REQUEST [en0]: 1,0:30:65:b:78:f3
badlogin: [192.168.111.65] APOP (<326023712.1082367660@resourceserver>) Error:-6: AOD: Authentication failed… <--- Kommer typ var 10:e RAD i loggen.
Apr 19 11:54:02 resourceserver kernel: arp: 169.254.45.253 moved from 00:30:65:0b:78:f3 to 00:0a:95:9d:96:3c on en0
…
Vad vill ni veta?
Låter som ett typiskt defekt grafikkort
Okej, vi har aldrig haft liknande problem tidigare. Bara nu senaste veckan.
Kan vara paj grafikkort, eller överhettat RAM. Kolla att alla fläktar är igång och att det är rätt tempererat rum.
Grafikkort - taget... RAM, okej? Vi har bytt det tre gånger nu. "Installationen" av G5:an var ju minst sagt skakig. Vi klonade ju bara disken från G4:an.
Temperaturen i rummet är bra - c:a 19-20°c, kylt med AC dygnet runt.
(gillar inte riktigt att din ÅF säger att 10.3 är kasst..)
Inte jag heller, men jag har för lite koll på området för att säga emot. Så här dåligt kan det docke vara gällande stabileten. Okej om en tjänst krashar eller om maskinen går ner någongång. Men inte flera gånger i veckan.
Att klona ett system från en hårdvaruplattofrm till en annan är inget jag skulle rekommendera. Vore det inte enklast att blåsa en backup på all data och göra en ren systeminstallation? Personligen skulle jag inte klona ett system jag kört på en G4:a till en G5:a.
Nu krashade skiten igen!
Mon Apr 19 18:50:43 2004
panic(cpu 0): copy_strategically: bad strategy
Latest stack backtrace for cpu 0:
Backtrace:
0x000834B8 0x0008399C 0x0001EDA4 0x0006A4A0 0x00075A04 0x00075B04 0x00237750 0x002372F0
0x00236FCC 0x00209EA0 0x002405B4 0x00093E20 0x004D0061
Kernel loadable modules in backtrace (with dependencies):
com.apple.NVDAResman(3.0.8)@0x4b1000
dependency: com.apple.iokit.IOPCIFamily(1.4)@0x39e000
dependency: com.apple.iokit.IOGraphicsFamily(1.3)@0x47c000
dependency: com.apple.iokit.IONDRVSupport(1.3)@0x49b000
Proceeding back via exception chain:
Exception state (sv=0x29119A00)
PC=0x900370AC; MSR=0x0000D030; DAR=0x00004124; DSISR=0x40000000; LR=0x90055F5C; R1=0xF0080A10; XCP=0x00000030 (0xC00 - System call)
Kernel version:
Darwin Kernel Version 7.3.0:
Fri Mar 5 14:22:55 PST 2004; root:xnu/xnu-517.3.15.obj~4/RELEASE_PPC
utan vidare kännedom om hur man bäst bör tolka kernelcrash loggarna gissar jag rent spontant på att något inte är rätt på hårdvarusidan, iokit'et är väl det som tar hand om det mesta vad gäller komunikationen mellan hårdvaran och OS?
Apr 19 18:42:33 localhost pop3d[3436]: login: h127n4fls23o1077.bredband.comhem.se[81.226.231.127] kalle APOP User logged in
[FEM RADER SKRÄPKOD]
27 localhost syslogd: restart
Apr 19 18:50:27 localhost syslogd: kernel boot file is /mach_kernel
Apr 19 18:50:27 localhost kernel: standard timeslicing quantum is 10000 us
Hur testar man om man har ruttna minnen?
Minnestestet ligger på installations-DVDn som följde med G5:an. Håll ner "Alt" när du startar så får du upp testskivan som val.
Allmänt har minnen till G5:an varit dåliga. Dåliga på så sätt att minnestestet hittar fel. En anledningen till vi bara tar hem Apples originalminnen på FMCC i fortsättningen.
Då var PCI-kort ute och minnen bytta igen. Förra minnesparet var det något fel på enligt Apple Hardware Test.
***FELKOD***FELKOD***
2MEM/1/4 DIMM1/J12
Sa den, så jag kör nu testet igen på det nya minnet.
Problemet jag har är att jag inte vet hur alla inställningar skall vara för allting. Kan man spara ner nuvarande inställningar och lägga in dem igen?